生成扩散模型漫谈:统一扩散模型(应用篇)

7956e911aa310b8e54317f4ccea103cc.gif

©PaperWeekly 原创 · 作者 | 苏剑林

单位 | 追一科技

研究方向 | NLP、神经网络

《生成扩散模型漫谈:统一扩散模型(理论篇)》中,笔者自称构建了一个统一的模型框架(Unified Diffusion Model,UDM),它允许更一般的扩散方式和数据类型。那么 UDM 框架究竟能否实现如期目的呢?本文先回顾 DUM 框架的一般流程,然后通过一些具体例子来演示其一般性。

326f658807adfe536a60aee9ceb80929.png

框架回顾

首先,UDM 通过选择噪声分布 和变换 来构建前向过程

06a183b2dddd090f7ec2c35624784369.png

然后,通过如下的分解来实现反向过程 的采样

5264edc4b807d109a948f3e40ef1b3dd.png

其中 就是用 预估 的概率,一般用简单分布 来近似建模,训练目标基本上就是 或其简单变体。当 是连续型数据时, 一般就取条件正态分布;当 是离散型数据时, 可以选择自回归模型或者非自回归模型。

至于 的最基准的选择就是

1710a34e37ebed1c9893eae40423e0d5.png

从这个基准出发,在不同的条件下可以得到不同的优化结果。当 关于 是可逆的,那么可以解出 ,然后得到更好的确定性采样方式

0c35eb36be12096b6fe6e69b4925da8a.png

更进一步,如果 是标准正态分布,那么可以得到

a4d0985d9b210b8119ff300123e2fd8d.png

5a8cc595a1cef4ed2a105c1337704221.png

热之扩散

现在这一节中,我们证明“热扩散模型”是 UDM 的一个特例,这里的热扩散(Hot Diffusion)指的是前面介绍的 DDPMDDIM 等主流的扩散模型,这个称呼出自下面的“冷扩散”论文中。

主流扩散模型处理的是连续型数据,以加性正态噪声来构建前向过程:

d32fcd00fa06d5f212f3f24905dfb1bc.png

的选择就是正态分布 ,一般不将 作为训练参数,所以略去常数项

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值