ddpm Denoising Diffusion Probabilistic Model 学习笔记

目录

Stable Diffusion

文章的贡献抽象出来就两个

潜空间上做扩散生成

ddpm(Denoising Diffusion Probabilistic Model)学习笔记

算法原理

unet预测噪声

unet推理过程

重参数化技巧

(1)利用前一时刻的 xt-1 得到任意时刻的噪声图片 xt(重参数化技巧)

ddpm条件生成图片即生成指定图片


Stable Diffusion

文章的贡献抽象出来就两个

:1)提出可以在潜空间上用diffusion学特征分布,而不是直接让diffusion 学图像,降低了diffusion模型的难度;2)可以用 cross-attention 方法给模型加条件搞条件生成,在 cross-attention 中,q来源于与上一步,k和v来源于条件编码。

潜空间上做扩散生成

之前的DM(diffusion model)大多是直接对图像做去噪扩散,生成出来的图像细节不太好,如果想生成高清大图又需要非常大的计算量。所以这里作者提出了一种在潜空间上做扩散生成的方式,另外还增加了文本条件生成。这些操作使得模型最终可以生成非常高清的图,而且跟像素级的DMs模型相比大大降低了计算量。

作者的贡献有:

1)与以往纯transformer的结构不同,作者的模型可以更优雅地扩展到更高纬度的数据,因此此工作可以(a)在压缩了的级别上提供更可靠更具体的重建细节,(b)可以更有效地生成百万像素高清图像。

ddpm(Denoising Diffusion Probabilistic Model)学习笔记

算法原理

一文弄懂 Diffusion Model(DDPM)+ 代码实现-CSDN博客

参考代码:

GitHub - LinXueyuanStdio/PyTorch-DDPM: 500 行代码实现降噪扩散模型 DDPM,干净无依赖

unet预测噪声

无论在前向过程还是反向过程,Unet的职责都是根据当前的样本和时间 t 预测噪声。

  • 训练阶段是一步预测出从0到t加的噪声noise
  • 推理阶段是根据模型算出该t时刻的噪声,然后用x_t减去该时刻的噪声noise得到x[t-1]

unet推理过程

训练时:给定原图和时间t,加上噪声,然后用unet预测噪声。

推理时,给定随机噪声和时间t,预测噪声,然后减去噪声,然后就是图像

重参数化技巧

(1)利用前一时刻的 xt-1 得到任意时刻的噪声图片 xt(重参数化技巧

ddpm条件生成图片即生成指定图片

https://github.com/LinXueyuanStdio/PyTorch-DDPM/blob/main/classifier_free_ddpm.py

unet预测噪声代码:

        h = x
        for module in self.down_blocks:
            h = module(h, t, y)
            hs.append(h)
        # middle stage
        h = self.middle_block(h, t, y)
        # up stage
        for module in self.up_blocks:
            cat_in = torch.cat([h, hs.pop()], dim=1)
            h = module(cat_in, t, y)
        return self.out(h)

从代码可以看到,y是想要生成的数字标签,y会进入unet的每一层指导生成,这样的话,笔者感觉任务一变更,网络结构可能就要调整,原始的unet也不能使用,看看其他的网络是否有改进。

  • 22
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI算法加油站

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值