昇思25天学习打卡第15天

最新推荐文章于 2024-09-05 11:40:28 发布

早睡早起001

最新推荐文章于 2024-09-05 11:40:28 发布

阅读量421

点赞数 5

分类专栏：活动体验文章标签：学习

本文链接：https://blog.csdn.net/m0_50969215/article/details/140447885

版权

25 篇文章 0 订阅

订阅专栏

Diffusion扩散模型（下）

数据集可以来自简单的真实数据集的图像组成，如Fashion-MNIST、CIFAR-10或ImageNet，其中线性缩放为[−1,1][−1，1]。

接下来，我们定义一个transform操作，将在整个数据集上动态应用该操作。该操作应用一些基本的图像预处理：随机水平翻转、重新调整，最后使它们的值在[−1,1][−1,1]范围内。

改进的去噪扩散概率模型（Nichol et al.， 2021）：发现学习条件分布的方差（除平均值外）有助于提高性能
用于高保真图像生成的级联扩散模型（[Ho et al.， 2021）：引入级联扩散，它包括多个扩散模型的流水线，这些模型生成分辨率提高的图像，用于高保真图像合成
扩散模型在图像合成上击败了GANs（Dhariwal et al.， 2021）：表明扩散模型通过改进U-Net体系结构以及引入分类器指导，可以获得优于当前最先进的生成模型的图像样本质量
无分类器扩散指南（[Ho et al.， 2021）：表明通过使用单个神经网络联合训练条件和无条件扩散模型，不需要分类器来指导扩散模型
具有CLIP Latents （DALL-E 2）的分层文本条件图像生成（Ramesh et al.， 2022）：在将文本标题转换为CLIP图像嵌入之前使用，然后扩散模型将其解码为图像
具有深度语言理解的真实文本到图像扩散模型（ImageGen）（Saharia et al.， 2022）：表明将大型预训练语言模型（例如T5）与级联扩散结合起来，对于文本到图像的合成很有效

学习时间以及学习id：

关注