随着文生图模型的日益成熟,图像身份特征的一致性迁移与风格多样化成为绘图领域的重要需求。为此,业界涌现出众多专注于特征保持和迁移的技术模型。本文将重点评测字节跳动与某书开源的三大主流技术方案:PuLID、IP-Adapter以及InstantId。
该模型是一款可出图商用的写实摄影模型。该模型在人物写实真实度方面有着优秀的图像质量,以及优秀的光影视觉冲击,丰富且富有感染力的情绪表达,不论是在影棚的时尚大片、真实感的户外摄影、自然的手机随拍、或是艺术写真方面均有不错的绘图表现。
PuLID模型简介
PuLID
是最新字节开源的,因此本文主要介绍PuLID
在SD-WebUI中安装指南。关于IP- Adapter
以及InstantId
请参考社区介绍。
PuLID
是一种类似于ip-adapter
的方法,用于保持面部身份特征和风格迁移模型
。PuLID
同时使用了insightface
嵌入和CLIP
嵌入,这与ip-adapter faceid plus
模型的做法类似。不过,在将图像传递给CLIP
之前,PuLID
会使用facexlib
进行额外的步骤,即将面部从背景环境中遮罩出来。PuLID
还使用了Eva CLIP
代替了普通的CLIP
。在attn overrides
方面,PuLID
也做了一些比IPAdapter
做了更多的事情,比如它对张量进行了零填充,并添加到隐藏状态的正交性中。更多PuLID
介绍参考之前文章:字节PuLID:高效身份ID特征定制,ComfyUI使用指南、字节PuLID:高效身份ID特征定制新方法,无需复杂微调仅一张图实现
PuLID安装指南
01. 安装sd-webui-controlnet-evaclip
扩展
PuLID
使用了evaclip嵌入
和insightface嵌入
作为proj模块
输入。因此,为了使用这个特性,需要安装sd-webui- controlnet-evaclip
插件,插件地址为:https://github.com/huchenlei/sd-webui-controlnet-
evaclip。
02. 模型下载
同时需要下载对应模型并放置在目录stable-diffusion- webui/models/ControlNet
下,可以在线下载:https://huggingface.co/huchenlei/ipadapter_pulid/resolve/main/ip-
adapter_pulid_sdxl_fp16.safetensors。
在这里需要注意facexlib 和evaclip
涉及的对应模型会首次运行时候自动下载。但在笔者测试中并未自动下载,经过调试插件代码和手动下载解决。
-
• 需要下载模型detection_Resnet50_Final.pth 、parsing_parsenet.pth 、parsing_bisenet.pth 、并放置在目录 /stable-diffusion-webui/models/GFPGAN/ 下,下载地址为:https://huggingface.co/damaimai/parsing_parsenet.pth/tree/main
-
• 原则上这会利用huggingface包自动下载,不用急着手动下载,在上面问题解决后可以再次运行查看是否自动下载。模型为:QuanSun/EVA-CLIP 放置 /stable-diffusion-webui/extensions/sd-webui-controlnet-evaclip/models ,需要使用huggingface_cli下载整个repo:https://huggingface.co/QuanSun/EVA-CLIP/tree/main
03. ControlNet单元设置
在ControlNet中需要设置一个额外的单选组选择PuLID模式,请注意升级ControlNet插件版本(请确保版本 >=1.449)。
04. PuLID体验
绘图配置
-
• 绘图模型:****墨幽人造人XL模型
-
• 迭代步数:30步
-
• 采样器:DPM++ 2M Karras
-
• CFG scale: 7
01. Fidelity风格效果
02. Style风格效果
在两种模式之间仅存在微笑差别 ,笔者并未看出明显差异。
02. 多输入图像
SDWebUI配置
输出效果
注意:与InstantId
相比,PuLID需要设置更强的提示才能使输出风格化。
多风格迁移模型评比
绘图配置和提示语等设置同上一小节,这里不在累述。
IP-Adapter配置
提示语中增加ip-adapter-faceid LoRA触发词:
IPA插件配置:
InstantId配置
InstantId插件则需要设置两个CN单元配置启用,并且请确保单元配置顺序:
CN单元0配置:
CN单元1配置:
输出效果对比
从从上面两组对比图中,能够显著看出面部特征保持ip-adapter 是最弱的,PuLId 和InstantId
都是保持一致性比较好的,但是能够明显看出InstantId 的风格更偏全景艺术风,而PuLId
是面部特征更偏向输入图像,这导致也会受输入图的清晰度影响输出效果。但InstantId 还存在问题是需要的显存资源较大。ip-adapter
是不仅面识特征保持别更重要是作为特征提取重要基础设施应用广泛。因此,评估效果各有优势,各视场景选择格式技术框架是最优方案。
另外,因为PuLId 使用了facexlib和eva clip,其资源利用效率不是很高。同时由于采用了正交计算,PuLId
在推理过程中比普通的ip-adapter 会慢不少。可能这也是官方演示时使用SDXL lightning的原因。
关于AI绘画技术储备
学好 AI绘画 不论是就业还是做副业赚钱都不错,但要学会 AI绘画 还是要有一个学习规划。最后大家分享一份全套的 AI绘画 学习资料,给那些想学习 AI绘画 的小伙伴们一点帮助!
对于0基础小白入门:
如果你是零基础小白,想快速入门AI绘画是可以考虑的。
一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以找到适合自己的学习方案
包括:stable diffusion安装包、stable diffusion0基础入门全套PDF,视频学习教程。带你从零基础系统性的学好AI绘画!

零基础AI绘画学习资源介绍
👉stable diffusion新手0基础入门PDF👈
(全套教程文末领取哈)
👉AI绘画必备工具👈
温馨提示:篇幅有限,已打包文件夹,获取方式在:文末
👉AI绘画基础+速成+进阶使用教程👈
观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
温馨提示:篇幅有限,已打包文件夹,获取方式在:文末
👉12000+AI关键词大合集👈
这份完整版的AI绘画全套学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】
