关于扩散模型的原理的个人理解

之前对于扩散模型预测一个正太分布的噪声就能work的原因一直不是很理解,最近终于有点想通了,在此记录一下,方便日后复习。

扩散模型训练时,对于不同的t,都添加的是一个符合正太分布的噪音noise_t,得到x_t,但是x_t是与t相关的一个值,而噪音noise_t尽管与t无关,对于x_t已经是一个固定的值,而x_t也因为t的关系有不同程度的加噪效果,换句话说,此时模型对于x_t作为输入进行预测噪音,尽管这个噪音的确也是符合正态分布的,但是是一个固定的值,也就是说网络是在学习一个固定的值,对于一个加噪的图片去除一个符合正态分布的其中一个固定的值,只有这个固定的值才能使得图片能够还原回去,换句话说在采样时对于一张噪音图,网络就能学会去除一个怎样的一个对于每个像素点固定的值才能使得这张噪音图,得到自己想要的数据分布的图。

结论:扩散模型的训练本质上就是在学习对于不同加噪程度的图片去除什么样的噪声 才能恢复出原本数据分布的过程

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值