AI 创业指难（一）：Stable Diffusion AI 绘画怎么用-CSDN博客

本文链接：https://blog.csdn.net/bagell/article/details/139800845

一年不到，AI对生活和工作的影响已经逐步体现。所以千万别掉队了，也许 AI 不能成为我们的主要工作，但是如何借助 AI 实现副业的扩展同样值得思考。

这一篇就来讲一个 AI 绘画工具，这个工具我也是才上手不久，所以我把这其中的一些笔记分享出来，希望大家都能融入到这个新的时代。

Stable Diffusion

stable diffusion 本质上是一个 AI 绘图生成工具，我想大家肯定听说过它的竞品： Midjourney 。

之所以选择 Stable Diffusion 的主要原因就是它免费，本地就可以搭建，开源资源丰富，适合我们这些业务人员去折腾。

基础安装太简单了，果然玩图的大佬都是热心肠，这里推荐直接使用秋叶大佬整合包。

启动的效果就是这样，入门使用只需要关注2个点：

几个好用的模型网站：

我这边也整理了3000+常用模型包，涵盖各样风格，需要的同样文末领取！

整个主界面大致如下，来简单说一下其中这些关键的信息：

模型就是我们在上述模型网站中找到的喜欢的模型，模型很多，我们只需要找到自己想要生成的去下载即可 ：

下载完模型后，将模型添加到工具的模型管理中，然后在主界面模型旁边点击刷新就能应用上去。

模型也有对应的类型，这里简单概述下：

对我这种新手来说基本上不关注这个，模型训练可能是后续的实践中才需要使用到。

Variational autoenconder，中文叫变分子编码器，主要的作用就是滤镜。在出图的时候会影响颜色和线条

一般大模型里面都会自带 VAE ， 出图如果有问题才可能需要用到它。

尝试了一下，左边的为原厂模型，右边加了其他 VAE. 虽然不明显，但是在颜色上还是有一些色差。

提示词分为正向提示词和反向提示词，

那么提示词该怎么去找，去哪里找呢？

方案一：通过 Stable Diffusion 的工具反推提示词

直接把图片拖进去，就能得到对应的提示词，后续直接使用即可。

方案二：去模型网站或者图站查找提示词

一般下载的模型下面都能找到一些效果图，点进去就能看到对应的提示词

方案三：找 GPT 问或直接写

采样方式指的是模型生成图像时所采用的策略，决定了如何从模型的输出分布中选择样本。

上文界面里面的采样方式主要有以下区别：

算法	速度	步数	优 / 缺点
Euler a		20-30	1. 适当的步长出图更快 2. 步长过大会过度拟合，图像变形
3. 富有创造力	ICON ，二次元，小场景
Euler		20-30	- 基于Karras论文
LMS		30+	1. 效果一般，比较抽象，质感OA,饱和度与对比度偏低，更倾向于动画的风格
2. 线性多步调度器（Linear multistep scheduler）
Heun		20-30	- 基于Karras论文
DPM2		20-30	该采样方法对tag的利用率最高，几乎占80％+
DPM2 a		25-30	几乎与DPM2相同，对人物可能会有特写
DPM++ 2S a		20-30
DPM++ 2M		20-30
DPM++SDE	慢
DPM++2S a Karras	慢		- 在每个时间步长中执行多次操作
- 同等分辨率下细节更多
- 步长越多细节越明显
写实人物，复杂场景
DPM++ 2M Karras		20-30	1. 是二阶扩展概率模型求解的算法 2. 可以在速度和质量之间平衡
DPM ++ SDE Karras	慢	8-12
DDIM	慢	10-15	1. 步数越多细节越丰富 2. 收敛快，可以快速生成高质量图像
写实人像，复杂场景刻画
UniPc		20-30
DPM adaptive		10
LMS Karras		20	会大改成油画的风格，写实不佳
DPM2 Karras		20-30
DPM2 a Karras		20-30