diffusion model classifier-guided与classifier-free的区别

最新推荐文章于 2024-06-05 17:21:52 发布

莫叶何竹

最新推荐文章于 2024-06-05 17:21:52 发布

阅读量758

点赞数 1

分类专栏： diffusion model 文章标签： diffusion model classifier free classifierguide

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_40779727/article/details/132314417

版权

diffusion model 专栏收录该内容

21 篇文章 13 订阅

订阅专栏

classifier-guided

classifier-guided pipeline (原创图，转发注明出处)

训练阶段

diffusion model 和 classifier分开训练。
diffusion model的数据训练数据为

classifier的数据训练数据为

生成图片阶段

每一个时间步的降噪中会用当前时间步图片在classifier的类别梯度来调整均值。（如上图所示）
之前写了一篇文章有详细介绍。
优点：
不用重新训练diffusion model就能引导朝向期望类别的图片生成。
缺点：
需要额外训练一个分类器，架构不够简洁
只能生成特定类别的图片，无法实现语义级别的生成。

2. classifier-free

classifier-free pipeline (原创图，转发注明出处)

训练阶段

只需训练diffusion model ，但该diffusion model有一个语义输入。一般采用cross-attention来将语义特征与图片特征进行融合。
diffusion model的数据训练数据为
是图片对应的语义描述。

生成图片阶段

生成阶段无需分类器引导。生成过程每一个时间步的生成需要将语义embedding也输入到diffusion model中，详细可参考
优点：
架构简洁
可以实现语义级别的图像生成如现在大火的stable-diffusion
缺点：
需要重新训练diffusion model，训练成本较大。stable diffusion 在Laion5B用了256张A100训练15w 机时，一般公司无法承担如此大的训练成本。

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
diffusion model classifier-guided与classifier-free的区别

需要重新训练diffusion model，训练成本较大。stable diffusion 在Laion5B用了256张A100训练15w 机时，一般公司无法承担如此大的训练成本。只需训练diffusion model ，但该diffusion model有一个语义输入。生成过程每一个时间步的生成需要将语义embedding也输入到diffusion model中，详细可参考。不用重新训练diffusion model就能引导朝向期望类别的图片生成。只能生成特定类别的图片，无法实现语义级别的生成。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。