文章目录
一、I2SB
1.解决非线性扩散
2.Schrödinger Bridge
3.适用于图像恢复任务
在这里插入代码片
这里是引用
二、Diffusion Model(李宏毅)
扩散模型 - Diffusion Model【李宏毅2023】
1. 框架:
三部分(1)理解输入Encoder(GPT、Bert)(2)加入噪声生成中间产物(Network)(3)生成图片Decoder(不需要文字)
1.1 Text Encoder
1.2
1.3【中间产物】为小图或网络训练的结果
2. 评价指标
真实图片和生成图片扔进Pretrain-CNN看最后一层特征的相似度。结果越小越好
2. 原理
1. Training
Ground Truth,训练数据
2.2 Sampleing
流程(DDMP)
三、数学推导
简单的分布生成复杂的分布
如何评估:极大似然估计(极大似然估计就是在只有概率的情况下,忽略低概率事件直接将高概率事件认为是真实事件的思想。)
极大似然估计和最小化交叉熵损失(KL散度)完全等价
某一张图的几率
在这里插入代码片
这里是引用