#爆火AI写真工具开源#

只需一张照片,不依赖模型训练,多风格 AI 写真瞬间呈现。

这是小红书团队最近刚开源的 #InstantID# 项目能够实现的效果。

该项目在 GitHub 一经发布便立即收获 4000+ 星标,还得到了图灵奖得主 Yann LeCun 的认可。

InstantID 是什么呢?

简而言之,它是一个基于扩散模型的图像生成解决方案,能实现从单一参考图像到多样化风格化写真的快速生成。

用户只需上传一张自拍,20 秒就能得到定制版 AI 写真。(之前爆火的妙鸭至少要传20张)

该开源项目的核心在于其 Zero-shot 技术,整个过程无需训练 LoRA 模型,就能实现高保真的 ID 保持。

据介绍,InstantID 巧妙地避免了对文生图模型 UNet 部分的训练,仅通过训练一个轻量级的可插拔模块,实现了在推理过程中无需 test-time tuning,同时保持了文本控制的灵活性,确保了面部特征的高保真度。【图3】

目前,InstantID 还允许用户进行五官夸张定制,与宠物的趣味合体,以及实现多身份和风格的创意合成。

体验地址:O网页链接
项目介绍主页:O网页链接
论文:O网页链接
GitHub:O网页链接