【Diffusion学习】【生成式AI】Stable Diffusion、DALL-E、Imagen 背後共同的套路

算法研究员

已于 2024-07-15 16:35:17 修改

阅读量597

点赞数 5

分类专栏：【Diffusion学习】文章标签：人工智能 stable diffusion

于 2024-07-15 16:34:09 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43154149/article/details/140441769

版权

【Diffusion学习】专栏收录该内容

6 篇文章

订阅专栏

文章目录

from: https://www.youtube.com/watch?v=JbfcAaBT66U&list=PLJV_el3uVTsNi7PgekEUFsyVllAJXRsP-&index=5

简介：

84,841次观看 2023年3月25日【機器學習 2023】(生成式 AI)
感謝黃敬峰先生提供字幕

Stable Diffusion
https://arxiv.org/abs/2112.10752

DALL-E series
https://arxiv.org/abs/2204.06125
https://arxiv.org/abs/2102.12092

Imagen
https://arxiv.org/abs/2205.11487

图片生成Framework 需要3个组件：

Text Encoder
Generation Model
Decoder

在这里插入图片描述

相关论文【Stable Diffusion，DALL-E，Imagen】

在这里插入图片描述

在这里插入图片描述

具体介绍三个组件

在这里插入图片描述

1. Text encoder介绍【结论：文字的encoder重要，Diffusion的模型不是很重要！】

在这里插入图片描述

评估指标：FID计算

在这里插入图片描述

CLIP Score 计算

在这里插入图片描述

3. Decoder介绍【不需要成对的训练资料】

在这里插入图片描述

在这里插入图片描述

2. Diffusion Model介绍【训练一个noise predicter】

在这里插入图片描述

noise 加在 latent representation上

在这里插入图片描述

在这里插入图片描述

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。