AI绘画：Stable Diffusion：初识与安装

最新推荐文章于 2025-03-18 11:52:40 发布

AI绘画月月

最新推荐文章于 2025-03-18 11:52:40 发布

阅读量689

点赞数 20

文章标签： AI作画 stable diffusion 人工智能 AIGC

本文链接：https://blog.csdn.net/2401_84760719/article/details/140948469

版权

前言

为了 ”易入门，快上手“ ，我去掉了复杂的技术原理解释，降低门槛，因为它不会影响入门使用。后期会在合适的内容中逐一讲解，利于理解。如有探索欲，建议研读论文（High-Resolution Image Synthesis with Latent Diffusion Models）。

一、Stable Diffusion 是什么？

Stable Diffusion（以下简称SD）是一个能将文本转化为图像的潜扩散模型（Latent Diffusion Model）

二、Stable Diffusion 的基本功能

给它一些文字作为提示，它给你符合条件的图像。

Stable Diffusion 运行3要素：条件、模型、方式

三、Stable Diffusion 的优势

免费
生成图像质量高，需要持续深入学习，因为它的下限也很低。
开源，生态丰富，有大量的插件和风格化模型，不断扩充和完善SD的创作和控制能力。
自由灵活，用户可以自行训练特定主题或风格的模型，满足特定的创作需求。
本地部署，消费级显卡即可迎战，数据安全。

同类AI绘画工具还有 Midjourney、Dall-E 等，它们上手更简单，用户通过简单了解后，便能做出精美画作。但它们属于闭源应用，用户只能基于厂家的设定框架使用，定制化创作能力和精细化控制能力均有所受限。

四、Stable Diffusion 能做什么？

1. 文生图（text2image）

文生图是SD最基本的能力，给它一些文字作为提示条件，它给出符合条件的图像。

文生图工作流程图

2. 图生图（image2image）

图生图是用一幅原始图作为提示条件，绘制出一幅近似它的新图像。也可以同时添加文字提示，新图像会受文字和原始图像的双重条件影响。

图生图工作流程图

3. 重绘（Inpainting）

重绘是将一幅原始图的局部或整体重新绘制出新的内容，新内容也可以通过文字作为提示条件。

以下是几种常用的应用类型：

局部修复、放大图像分辨率

画幅和细节延展

局部换装（原照片取自网络素材，如有侵权请告知。）

4. 制作视频（Make videos）

SD制作视频有两种方法：

1. 通过文字生成，deforum 就是一款非常流行的文字转视频的工具。

2. 通过视频生成，基于一个原视频，结合文字提示，生成出一个新视频。

原视频（取自网络素材，如有侵权请告知。）

生成视频

Stable Diffusion 的强大能力和生态发展，激发创作者们不断地探索应用场景和惊艳的效果。

五、Stable Diffusion 本地安装（Windows）

Stable Diffusion 原本应用在代码环境中，随着各种用户界面被开发出来，如Stable Diffusion WebUI、ComfyUI、Fooocus和StableSwarmUI等，普通用户才得以使用。

Stable Diffusion WebUI 当属目前最流行的用户界面之一，它出现最早，生态庞大，插件丰富。

如果想省心，可以使用秋葉大佬的整合包。以下内容为喜欢自己折腾的技术控朋友们准备。（需要网络畅通）

硬件要求

最低配置建议，上无封顶。

CPU：10代i5
内存：16G DDR4内存
显卡：Nvdia RTX 2060super 8G
硬盘：1T以上
如有预算升级配置，优先顺序：显卡（优先大显存） > 内存 > 固态硬盘

安装驱动

1. 更新显卡驱动到最新版本

2. 安装CUDA工具包

查询显卡CUDA版本：打开CMD控制台，输入以下指令
```
nvidia-smi
```
下载版本适配的CUDA工具包
安装后检查状态：打开CMD控制台，输入以下指令
```
nvcc -V
```

3. 安装CUDA深度神经网络库（提速）—— cuDNN(CUDA Deep Neural Networks library)

查看版本匹配要求）
cuDNN下载 ，将文件夹“bin、include、lib"复制到cuda v1.2.x内，通常默认路径为：C:/Program Files/NVIDIA GPU Computing Toolkit/CUDA/

安装运行依赖

1. 安装 Python 3.10.6，安装时勾选 “Add Python to PATH”。

检查安装是否成功：打开CMD控制台，输入以下指令
```
Python
```

2. 安装 Git（分布式版本管理软件，几乎所有关于SD的用户界面程序、插件、脚本都在这里）

检查安装是否成功：启动控制台（Win+R > 输入cmd），在控制台输入指令
```
git --version
```
解决网络问题：如果发现网络OK，但git失败，下载 host 将内容加入到电脑中host文件末尾。

3. 安装 FFMPEG（用于录制、转换和串流式传输音视频内容。一些插件会需要。例如 Temporal Kit）

步骤1：解压文件，打开到有ffmpeg.exe的路径，复制路径
步骤2：右键My PC > 属性 > 高级系统设置 > 高级 > 环境变量 > 找到系统变量中的Path > 编辑 > 新建 > 粘贴路径
步骤3：打开CMD控制台，输入指令以下，显示满屏字则成功。
```
ffmpeg
```

4. 安装 Visual Studio

5. 选择性安装 Cmake（某些AI程序依赖是C语言写的，建议安装，避免安装依赖时报错）

本地安装 Stable Diffusion WebUI

1. 下载安装 Automatic1111的sd webui

步骤2：输入以下指令

git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui

步骤3：下载基础模型，例如 v1-5-pruned-emaonly.safetensors，存储到 \models\Stable-diffusion\
步骤4：用记事本打开 webui-user.bat，首行添加文字 git pull（每次运行时自动检测更新），在set PYTHON= 后面添加Python文件地址（右键点击Python.exe，复制文件地址。）

2. 版本升级与降级

某些插件因长久未更新，可能与新版sd-webui不兼容，因此需要降低sd-webui版本。

更新到最新版本：用记事本打开 webui-user.bat，添加文字 git pull，保存后运行。
恢复到指定版本：用记事本打开 webui-user.bat，添加文字 git reset --hard 版本ID，保存后运行。版本ID查询（AUTOMATIC1111的Releases页面）。以1.10.0-RC版本类似：

3. 汉化

步骤1：安装汉化扩展，URL地址：https://github.com/VinsonLaro/stable-diffusion-webui-chinese
步骤2：设置 > Ueser interface > Localization（requires Reload UI） > 选择chinese-all 或 chinese-english

除此以外还可以云部署，网上的安装教程有很多，我决定不增加篇幅了。

这里直接将该软件分享出来给大家吧~