I2SB: Image-to-Image Schrödinger Bridge(扩散模型学习)
三部分(1)理解输入Encoder(GPT、Bert)(2)加入噪声生成中间产物(Network)(3)生成图片Decoder(不需要文字)(极大似然估计就是在只有概率的情况下,忽略低概率事件直接将高概率事件认为是真实事件的思想。真实图片和生成图片扔进Pretrain-CNN看最后一层特征的相似度。Ground Truth,训练数据。简单的分布生成复杂的分布。3.适用于图像恢复任务。
原创
2024-03-25 15:12:51 ·
501 阅读 ·
0 评论