【前沿技术】扩散模型Stable Diffusion原理与应用

AI想象家

于 2024-08-28 10:02:58 发布

阅读量415

点赞数 6

文章标签： stable diffusion 人工智能深度学习 midjourney 机器学习 AI作画 AIGC

本文链接：https://blog.csdn.net/J708090/article/details/141633233

版权

Stable Diffusion是一种基于扩散模型（Diffusion Models）的生成技术，近年来在图像生成和其他生成任务中取得了显著的进展。该技术以其高质量的生成效果、稳定的训练过程和广泛的应用前景，迅速在学术界和工业界引起了广泛关注。

以下是关于Stable Diffusion的详细介绍。

01 Diffusion Model的概念

在前向的过程中，不断地向数据中加入噪音，让图像由原本的状态转化为噪音点，最后变成纯噪声。加入的噪声要满足固定的分布，比如标准的高斯分布。前向的过程也称为扩散的过程。

图：向原始图片中线性添加噪声的变化过程

扩散模型的逆向过程是利用贝叶斯公式，从噪声图片中一步一步的去噪，倒推拟合加上噪音前的那张图片。扩散模型的逆向过程也可以用信息熵的变化来解释。从高熵的纯噪声状态开始，逐步减少数据的随机性和不确定性，通过去噪过程逐步恢复原始数据的结构和特征。

Diffusion Model总结为“前向加噪-反向降噪-训练”的结构。

02 Stable Diffusion介绍

Stable Diffusion建立在Latent Diffusion Models的基础上，借鉴了Google的Imagen，实现了将文字prompt作为条件参与到扩散模型的生成过程中。扩散模型不同于VAE和GAN，扩散模型是从噪音点中一步一步生成，因此需要的计算资源更多。Stable Diffusion可以规避模式坍塌的问题，这类问题常常存在于GAN训练的过程中。（模型坍塌，Mode-collapse，是指生成器倾向于生成同一类别的样本，而忽略了数据集中其他模式的存在。）

图：用Stable Diffusion和DALL-E、VQGAN生成图与原始图片的对比

此外，通过引入交叉注意力层到Stable Diffusion的模型可以将文本、边界框与图像通过统一的方式折射到扩散模型中。由此可实现Stable Diffusion在图像修复、以类别为条件的图像生成、文本生成图像、无条件的图像生成等任务上很好的性能。

图：交叉注意力机制调节LMDs的原理图

03 Stable Diffusion与VAE、GAN的对比

表：Stable Diffusion、VAE、GAN在原理、优缺点等方面的对比表格

综上，Stable Diffusion通过扩散过程生成样本，可以产生高质量的结果，但计算成本较高。VAE提供了一种概率框架，可以学习潜在空间并从中采样，但生成的样本可能不够锐利。GAN通过对抗学习生成高度逼真的样本，但训练过程较为复杂且不稳定。

尽管这三种模型各有优缺点，但在某些情况下，Stable Diffusion相比于VAE和GAN可能更具优势。特别是当需要高质量的图像生成、支持丰富的条件生成任务（如文本到图像）、并且可以接受较高的计算成本时，Stable Diffusion是一个很好的选择。此外，Stable Diffusion 的训练和使用相对更加稳定，这使得它在实际部署中更为可靠。

最终，选择哪种模型取决于具体的应用需求、可用的计算资源以及对生成样本质量的要求。例如，如果项目预算有限且对生成速度有要求，则可能更倾向于使用VAE；如果需要生成非常真实的图像且愿意投入更多的时间和计算资源，则Stable Diffusion可能更适合。

这里直接将该软件分享出来给大家吧~

1.stable diffusion安装包

随着技术的迭代，目前 Stable Diffusion 已经能够生成非常艺术化的图片了，完全有赶超人类的架势，已经有不少工作被这类服务替代，比如制作一个 logo 图片，画一张虚拟老婆照片，画质堪比相机。

最新 Stable Diffusion 除了有win多个版本，就算说底端的显卡也能玩了哦！此外还带来了Mac版本，仅支持macOS 12.3或更高版本。

在这里插入图片描述

2.stable diffusion视频合集

我们在学习的时候，往往书籍源码难以理解，阅读困难，这时候视频教程教程是就很适合了，生动形象加上案例实战，一步步带你入坑stable diffusion，科学有趣才能更方便的学习下去。

在这里插入图片描述

3.stable diffusion模型下载

stable diffusion往往一开始使用时图片等无法达到理想的生成效果，这时则需要通过使用大量训练数据，调整模型的超参数（如学习率、训练轮数、模型大小等），可以使得模型更好地适应数据集，并生成更加真实、准确、高质量的图像。

在这里插入图片描述

4.stable diffusion提示词

提示词是构建由文本到图像模型解释和理解的单词的过程。可以把它理解为你告诉 AI 模型要画什么而需要说的语言，整个SD学习过程中都离不开这本提示词手册。

在这里插入图片描述

5.SD从0到落地实战演练

在这里插入图片描述

如果你能在15天内完成所有的任务，那你堪称天才。然而，如果你能完成 60-70% 的内容，你就已经开始具备成为一名SD大神的正确特征了。

这份完整版的stable diffusion资料我已经打包好，需要的点击下方插件，即可前往免费领取！
在这里插入图片描述

AI想象家

关注

6
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
【前沿技术】扩散模型Stable Diffusion原理与应用

Stable Diffusion是一种基于扩散模型（Diffusion Models）的生成技术，近年来在图像生成和其他生成任务中取得了显著的进展。该技术以其高质量的生成效果、稳定的训练过程和广泛的应用前景，迅速在学术界和工业界引起了广泛关注。以下是关于Stable Diffusion的详细介绍。01 Diffusion Model的概念在前向的过程中，不断地向数据中加入噪音，让图像由原本的状态转化为噪音点，最后变成纯噪声。加入的噪声要满足固定的分布，比如标准的高斯分布。前向的过程也称为扩散的过程。图：向原
复制链接

扫一扫