【无标题】

最新推荐文章于 2024-08-19 18:33:44 发布

Ai君臣

最新推荐文章于 2024-08-19 18:33:44 发布

阅读量297

点赞数 2

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/liuchenbaidu/article/details/140549454

版权

ControlNet: 一个基于 Stable Diffusion 1.5 的轻型预训模型，能利用输入图片（input image）里的边缘特征、深度特征或人体姿势的骨架特征（posture skeleton），配合文字prompt，精确引导图像在 SD1.5 里的生成结果。

6天后，腾讯 ARC 也发布了类似解决方案 T2I-Adapter。

ControlNet 和 T2I-Adapter 的框架都具备灵活小巧的特征，训练快，成本低，参数少，很容易地被插入到现有的文本-图像扩散模型中

和img2img 区别：

img2img 的input image 提供的引导主要是噪音的分布，影响构图和颜色，但对生成对象形状(边缘) 的与输入图片的贴合度并不高（鹿角特别明显）。

1、ControlNet训练

ControlNet 论文里提到，

Canny Edge detector 模型的训练用了300万张边缘-图像-标注对的语料，A100 80G 的 600个 GPU小时。

Human Pose （人体姿态骨架）模型用了8万张姿态-图像-标注对的语料, A100 80G的 400个 GPU 时。

2、T2I-Adapter训练

4块Tesla 32G-V100 上只花了2天就完成，包括3种 condition，sketch（15万张图片语料），Semantic segmentation map（16万张）和 Keypose（15万张）。

3、T2I-Adapter 支持一种以上的 condition model 引导，

比如可以同时使用 sketch 和 segmentation map 作为输入条件，或在一个蒙版区域 (也就是 inpaint ) 里使用 sketch 引导。

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
【无标题】

ControlNet: 一个基于 Stable Diffusion 1.5 的轻型预训模型，能利用输入图片（input image）里的边缘特征、深度特征或人体姿势的骨架特征（posture skeleton），配合文字prompt，精确引导图像在 SD1.5 里的生成结果。6天后，腾讯 ARC 也发布了类似解决方案 T2I-Adapter。ControlNet 和 T2I-Adapter 的框架都具备灵活小巧的特征，img2img 的input image 提供的引导主要是噪音的分布，。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Ai君臣 学会的就要教给人

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。