High-Resolution Image Synthesis with Latent Diffusion Models论文学习

李小星同志

已于 2024-09-05 20:55:58 修改

阅读量98

点赞数

文章标签：学习

于 2024-09-05 18:57:43 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/LI_XIAO_XING/article/details/141938159

版权

想要研究多模态数据生成就要研究diffusion架构。今天通过这个论文来学习一下。

在此之前先通过博文扩散模型 (Diffusion Model) 之最全详解图解-CSDN博客学习一下。

GAN就是生成对抗模型，让两个模型打擂台，一个造假一个打假。

而diffusion模型则是从原始数据Pdata(真实的图像)出发，不断地给他加上高斯噪声，让他面目全非，然后再复原。这个复原过程是可以学习的。

上述过程也被称为扩散与逆扩散。

这里要记录两个概念：后验概率与马尔卡夫链。

后验概率就是说在某件事情已经发生的情况下，推测这件事是因为什么原因产生的概率。在diffusion模型中，我们是先加噪声，然后逆向还原，这个过程其实就是计算后验概率的过程，我们先得到被加了噪声的图片，然后以此为基础推测各个像素点经历了什么，原本是什么样。

马尔卡夫链就是一系列随机过程，每一个节点的情况只和上一个节点的情况有关，不会受到上上个节点等更远的节点的影响。diffusion模型中的扩散过程就是一个马尔卡夫过程。

接下来是对一些细节的更加数学化的描述。

前向过程的详细解释

这里就遇到一个问题了。我们做深度学习肯定要能反向传播，要能求导，但这边全都是随机过程，系数在哪里？

这样就有系数，可以导了。

逆向过程详细解释

李小星同志

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
High-Resolution Image Synthesis with Latent Diffusion Models论文学习

而diffusion模型则是从原始数据Pdata(真实的图像)出发，不断地给他加上高斯噪声，让他面目全非，然后再复原。这个复原过程是可以学习的。想要研究多模态数据生成就要研究diffusion架构。今天通过这个论文来学习一下。GAN就是生成对抗模型，让两个模型打擂台，一个造假一个打假。上述过程也被称为扩散与逆扩散。
复制链接

扫一扫

李小星同志 CSDN认证博客专家 CSDN认证企业博客

码龄4年

193: 原创

1万+: 周排名

1万+: 总排名

26万+: 访问

: 等级

2408: 积分

537: 粉丝

376: 获赞

26: 评论

1596: 收藏

私信

关注

热门文章

分类专栏

最新评论

计算机组成原理：原码的乘法运算
zhi21yuan15: 谢谢,解决了疑惑。
计算机组成原理：原，反，补码，加减运算，溢出判断，符号扩展
做而论道_CS: 变形补码、双符号位！一直也没有听说，谁家的 CPU 有这种配置。 Intel 的 CPU 中，有一个溢出标志位 OF。它可以自动判别并给出：运算是否溢出！已经有这个现成的标志，还研究 “双符号位” 干嘛？－－－－－－－－－－－－任何一个数，无论是一个字节，或是一个字，都只有一个符号位。是在计算的时候，多弄一个符号位吗？　16 位的 CPU，用 17 位来计算？　32 位的 CPU，用 33 位来计算？什么品牌型号的 CPU，有这种功能啊！从来就没有听说过。双符号位、变形补码，只是某些老师的梦呓而已。不能当真的。
计算机组成原理：原，反，补码，加减运算，溢出判断，符号扩展
做而论道_CS: 另外，计算机行业有个翻番的摩尔定律。现在的计算机，比 8086，都不知翻多少番了！现在的计算机中，已经不是 “只有加法器” 了做运算，现在用的是 ALU (算术逻辑单元)。在 ALU 的功能中，已经有了减法运算！那么，想要相减，直接相减就可以了。计算机专业的老师，对此视而不见！仍然喋喋不休的讲 “取反加一”。为什么呢？居心叵测呀！现在终于知道我们缺芯片用的原因了。
计算机组成原理：原，反，补码，加减运算，溢出判断，符号扩展
做而论道_CS: 实际上，计算机只有二进制数。并没有什么符号位原码反码补码。二进制数，也是数，和十进制数，是雷同的。－－－－－－－－－－－－－－－－－－－－－如果使用数字，代表其它信息，才叫做 “码”。如：学号、门牌车牌电话性别书号密码等等。－－－－－－－－－－－－－－－－－－－－－所谓的 “补码”，实际上，它就是一个正数。正数，能当负数用吗？能！关键在于：【舍弃进位】！你看十进制数，两位，范围是：0 ~ 99。那么：38 + 99 = (一百) 37 　　　38 － 1 = 37 舍弃进位，这两种算法，功能就是相同的。　正数，就能当负数来用！　加法，就成了减法！在计算机中，利用此思路，减法器，就省掉了！八位二进制，范围是：0000 0000 ~ 1111 1111。相当于十进制的：0 ~ 255。如果舍弃进位，255 (即 1111 1111)，就能当－1 来使用。你用二进制加法，算一下，便可证明出来。同理，254 (即 1111 1110)，就是－2 了。继续，253 (即 1111 1101)，就是－3 了。。。。这些正数，就被计算机专家称之为：补码。实际上，它们仍然还是数！称为 “码”，是因为，计算机专家不懂算术。由 255 (即 1111 1111) 能当－1，可知：　负数的补码＝ 256 ＋该负数。例题：－50 的补码是什么？求解： 256 ＋ (－50) ＝ 206，　　　 206 = 1100 1110 (二进制)。求补码，就是这么简单！所谓的：　机器数真值符号位原码反码补码正数三码相同　负数取反加一符号位不变模同余符号位也参加运算 ,,, 都是毫无用处的垃圾！正数和零的补码，也可以用这个公式，即：　正数的补码＝ 256 ＋该正数。加上 256，就出现了进位。把进位舍弃掉，就是：　正数的补码＝ 256 ＋该正数　　　　　　＝该正数。这就证明了：正数和零的补码，就是其本身。
数理逻辑 2
csy031117: 是 hitsz 的学长吗？😊

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。