扩散模型 - Stable Diffusion

最新推荐文章于 2025-03-28 14:30:00 发布

Mitchell_C

最新推荐文章于 2025-03-28 14:30:00 发布

阅读量2.8k

点赞数 4

文章标签： stable diffusion 人工智能深度学习

本文链接：https://blog.csdn.net/qq_43505867/article/details/131017318

版权

4 Stable Diffusion

Stable Diffusion 是由 Stability AI 开发的开源扩散模型。Stable Diffusion 可以完成多模态任务，包括：文字生成图像（text2img）、图像生成图像（img2img）等。

4.1 Stable Diffusion 的组成部分

Aspose.Words.6814f570-13ec-4448-b348-dd134ab150e5.020.jpeg

Stable Diffusion 由两部分组成：

文本编码器：提取文本 prompt 的信息
图像生成器：根据文本 embedding 生成图像
- 图像信息创建器：多步扩散过程。步长是其中一个超参数
- 图像解码器：只在最后生成图像时运行一次
**文本编码器：**由一种特殊的 Transformer 编码器组成，例如：OpenAI 的 Clip。
图像信息创建器：由自编码器（通常是 U-Net）和噪音机制组成。
图像解码器：由自编码器的解码器组成。

Stable Diffusion Pipeline：

Clip：文本信息编码
- 输入：文本
- 输出：77 token 的 embedding 向量，每个包含 768 维
U-Net + Noise Scheduler：逐渐把信息扩散至潜空间中
- 输入：文本 embedding 和由噪音组成的多维 tensor
- 输出：处

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Mitchell_C

关注关注

4
点赞
踩
19

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

Stable Diffusion扩散模型【详解】小白也能看懂！！

qq_23022733的博客

04-04

4877

2、因为每一个像素都有自己的分布，都要预测出一个均值和方差，所以网络输出的尺寸需要和图像尺寸一致，所以我们选用 Unet 网络，假设数据集中有100张图片，每张图片的shape是4x4x3，假设每张图片的每个channel的每个像素点都服从正态分布，图像加噪不是在原有图像上进行加噪的，而是通过把图片的每个像素的值转换为-1到1之间，比如像素的值是。去噪是加噪的逆过程，由时间T时刻的图像逐渐去噪到时刻为0的图像，求导，但是对于扩散的过程是不可行的，如下面的公式无法求出，因为。

人工智能-扩散模型-基于扩散模型stable diffusion的T恤图案设计和基于HR-VITON的虚拟试衣项目

10-28

首先，Stable Diffusion是一种先进的扩散模型，它通过向图像中加入噪声再逐渐还原的过程，能够生成高质量的图像。在本项目中，Stable Diffusion结合Dreambooth技术，使得用户可以通过简单的文本指令，生成符合特定...

参与评论您还未登录，请先登录后发表或查看评论

关于AI绘画Stable diffusion的各种模型，看这篇就可以了！

白帽阿叁的博客

05-23

2698

Stable diffusion的模型除了上述的分类之外，从用途上看，还分为官方模型、二次元模型（动漫）、真实系模型和2.5D模型四大类。4.1 官方模型官方模型有 1.X 和 2.X 两个大版本，目前在 1.X 中官方发布的有四个版本，分别是v1-1、v1-2、v1-3、v1-4如无法下载，请看文末扫描获取。

Stable Diffusion超详细教程！从0-1入门到进阶_stablediffusion

最新发布

m0_71746299的博客

03-28

1575

1、Canny边缘检测Canny通过使用边缘检测器创建高对比度区域的轮廓来检测输入图像。线条可以捕捉到非常详细的信息，但如果你的图像背景中有一些物体，它很可能会检测到不需要的物体。所以背景中物体越少效果越好。用于此预处理器的最佳模型是control_sd15_canny。这个预处理器有助于生成输入图像的深度估计。深度通常用于控制图像内物体的空间定位。浅色区域意味着它离用户更近，而深色区域则离用户更远。在大图像时它可能会丢失图像内部的细节(面部表情等)。

Stable Diffusion模型介绍

A2421417624的博客

04-07

1945

AIGC技术的未来发展前景广阔，随着人工智能技术的不断发展，AIGC技术也将不断提高。未来，AIGC技术将在游戏和计算领域得到更广泛的应用，使游戏和计算系统具有更高效、更智能、更灵活的特性。同时，AIGC技术也将与人工智能技术紧密结合，在更多的领域得到广泛应用，对程序员来说影响至关重要。未来，AIGC技术将继续得到提高，同时也将与人工智能技术紧密结合，在更多的领域得到广泛应用。感兴趣的小伙伴，赠送全套AIGC学习资料和安装工具，包含AI绘画、AI人工智能等前沿科技教程，模型插件，具体看下方。

Stable Diffusion模型概述

weixin_42010722的博客

01-02

2901

在Stable Diffusion v1中，VAE文件用于改善眼睛和面部的效果。它们是我们刚刚讨论的自动编码器的解码器。通过进一步微调解码器，模型可以呈现更精细的细节。你可能意识到我之前提到的并不完全正确。将图像压缩到潜在空间确实会丢失信息，因为原始的VAE没有恢复出精细的细节。相反，VAE解码器负责绘制精细的细节。这篇文章不完整，没有解释分类器免费引导（CFG），这是AI艺术家每天都在调整的一个值。为了理解它是什么，我们首先需要谈谈它的前身，分类器引导…

【stable diffusion模型】深入了解Stable Diffusion模型架构和核心组件（CLIP/Unet/VAE）

z19981的博客

01-06

1379

Stable Diffusion 是一种基于扩散技术的深度学习文本转图像模型，利用潜在扩散模型（Latent Diffusion Model，LDM）来生成高质量的图像。它主要用于生成以文字描述为条件的详细图像，但也可应用于其他任务，如 inpainting（图像修复）、outpainting（图像扩展）以及根据文字提示词生成图像到图像（image-to-image）的转换。

stable diffusion（stable-diffusion-webui-rembg）抠图模型

07-23

"Stable-diffusion-webui-rembg" 是一个基于稳定扩散算法的Web用户界面，专为背景去除或抠图设计。这个项目可能包含了一系列的模型，用于不同场景的抠图需求。描述中提到的模型文件名包括： 1. silueta.onnx：这是...

Stable-Diffusion-WebUI（秋叶）和Stable-Diffusion–forge

05-10

- **扩散模型**：Stable Diffusion的核心是扩散模型(diffusion model)，这是一种概率建模方法，它模拟了图像从纯噪声逐渐变为清晰图像的过程。该过程通常由一系列小步骤组成，每一步都会稍微减少一些噪声，直到最终...

关于Stable diffusion的各种模型，看这篇就可以了！

小王的储物间

06-29

2048

Stable diffusion的模型除了上述的分类之外，从用途上看，还分为官方模型、二次元模型（动漫）、真实系模型和2.5D模型四大类。4.1 官方模型官方模型有 1.X 和 2.X 两个大版本，目前在 1.X 中官方发布的有四个版本，分别是v1-1、v1-2、v1-3、v1-4。

Stable diffusion扩散模型相关

hn_lgc的专栏

02-17

7199

作者：路橙LuChengTHU链接：https://www.zhihu.com/question/536012286/answer/2533146567来源：知乎变分后验分布的表达能力与计算代价的权衡一直是VAE领域的核心痛点。GAN还需要额外训练判别器，这导致训练很困难；normalizing flow需要模型是可逆函数，不能随便用一个图像分类or分割领域的SOTA神经网络，这也导致模型表达能力受限。

stable diffusion模型讲解

libaiup的博客

05-13

981

Stable Diffusion

热门推荐

四问四不知的博客

10-17

3万+

AI绘图

Stable Diffusion扩散模型 + Consistency一致性模型

ZhengrongYue的博客

04-15

6508

Stable Diffusion扩散模型

Stable Diffusion扩散模型【详解】新手也能看懂！！

2401_84760322的博客

09-28

1900

1、Diffusion的整体过程2、加噪过程2.1 加噪的具体细节2.2 加噪过程的公式推导3、去噪过程3.1 图像概率分布4、损失函数5、伪代码过程此文涉及公式推导，需要参考这篇文章：Stable Diffusion扩散模型推导公式的基础知识。

扩散模型stable diffusion部署

01-09

### Stable Diffusion 模型部署教程 #### 准备工作环境为了成功部署Stable Diffusion，在本地环境中需满足一定的前提条件。这通常涉及配置合适的硬件设施，如具备良好性能的GPU支持CUDA运算，以及安装必要的软件依赖项，比如Python解释器及其相关库文件等[^1]。 #### 获取模型及相关资源访问Stable Diffusion官方社区平台上的“Models-Embeddings”频道能够获取到多种预训练好的模型权重文件以及其他辅助工具或插件，这些对于加速项目进展十分有帮助[^2]。 #### 安装与设置Web UI 利用由开发者AUTOMATIC1111所创建并维护于GitHub平台上开源发布的StableDiffusion Web UI应用程序来简化操作流程。该程序提供了一个友好的图形化界面，使得即使是没有编程经验的新手也能轻松上手进行图片创作活动；同时它还允许使用者通过简单的点击完成大部分常规任务而无需深入理解底层技术细节[^4]。 ```bash git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git cd stable-diffusion-webui pip install -r requirements.txt ``` #### 运行服务端口监听命令当一切准备就绪之后，则可通过执行特定脚本来启动服务器实例，并指定其对外开放的服务地址及端口号以便远程连接访问： ```bash python webui.py --listen --port=7860 ``` 以上即为完整的Stable Diffusion部署指南概览，涵盖了从前期准备工作直至最终上线运行所需经历的主要环节。