告别邪典！带你快速入门Stable Diffusion文生图-CSDN博客

本文链接：https://blog.csdn.net/xxue345678/article/details/135876067

Stable Diffusion系统教学

大家好，这里是ArtfulSoul

一个带你领略AI魅力的领路人

今天给大家带来SD系统教学的第二篇

带你快速入门

打开AI文生图的精彩世界

本地汉化拓展安装

SDWebui原生界面为全英文，为了更符合国人操作习惯，建议大家先安装本地汉化拓展，方便后续使用体验。

进入SDWebui界面后，点击上方Extensions（拓展）选项卡，在Installed（已安装）副选项卡中可以查看已安装的拓展插件，原生状态下只有最底下8个内置插件，后续所有安装的拓展插件均会在这个板块内显示，方便我们对插件进行统一管理。

红色方框内就是我们这次需要安装的由b站UP主秋叶制作的本地汉化拓展。

点击Installed from URL（通过连接安装）副选项卡

https://github.com/hanamizuki-ai/stable-diffusion-webui-localization-zh_Hans

在第一个方框内粘贴上方汉化插件安装地址后，点击Install（安装）即可完成安装。

注：安装过程可能需要使用魔法上网。

或者进入上方安装地址直接下载安装包，将下载完成的安装包解压至SDWebui根目录下的extensions文件夹中。

安装成功后，回到Installed（已安装）副选项卡，此时在拓展列表中可以看到汉化插件已被安装，这时点击上方Apply and Restart UI（应用并重启UI），重新加载UI界面。

重新加载完UI界面后，点击上方Settings（设置）选项卡，找到下方User Interface（用户界面）副选项卡。

在右侧上方找到Localization（本地化），在下拉选项框中选择"zh-Hans（Stable）"。

注：此步如果下拉框没有看到选项，请回到上步重新安装。

点击上方Apply Settings（保存设置）后，重新加载UI。

加载完成后，用户界面就会变成我们熟悉的中文界面。

文生图界面功能介绍

点击“文生图”选项卡，顾名思义，该界面就是通过输入提示词（prompt）以及设置一系列调整参数，进而生成你想要的图片。

Stable Diffusion 模型

Stable Diffusion模型，简称Checkpoint（CKPT）。

由于文件大小常在2G-10G左右，也被称作大模型，文件后缀名通常为safetensors和ckpt。

大模型的主要作用是用来定义作图风格的，根据风格大致可分为三个大类，这里附上推荐模型的下载地址：

（1）二次元风格

AbyssOrangeMix3（AOM3）

https://civitai.com/models/9942?modelVersionId=17233

Anything V5（PrtRe）

https://civitai.com/models/9409?modelVersionId=30163

Counterfeit V3.0

https://civitai.com/models/4468/counterfeit-v30

（2）2.5D

Guofeng3 V3.4

https://civitai.com/models/10415/3-guofeng3

NeverEndingDream（NED）v1.22 baked vae

https://civitai.com/models/10028/neverending-dream-ned

Protogen x5.3 (Photorealism) Official Release

https://civitai.com/models/3816/protogen-x53-photorealism-official-release

（3）真实系

ChillOutMix

https://civitai.com/models/6424/chilloutmix

Deliberate V3

https://civitai.com/models/4823?modelVersionId=156110

LOFI

https://civitai.com/models/9052/lofi

Realistic Vision V5.1

https://civitai.com/models/4201?modelVersionId=130072

以上所有大模型文件均需要保存在SDWebui根目录下models\Stable-diffusion文件夹中。

回到webui界面，点击右侧蓝色按钮刷新即可在下拉菜单中看到下载的大模型文件，点击对应的大模型文件进行模型加载。

提示词（prompt）

界面的正中间有两块输入提示词的地方，上方为正向提示词，下方为负向提示词。

**正向提示词：**输入想要画面出现的元素

**负向提示词：**输入想要避免画面出现的元素

提示词书写原则

1、必须使用**英文字符（包括标点符号）**书写，否则系统无法识别

2、提示词与提示词之间必须使用 **,****（英文逗号）**进行分割

3、提示词越靠前识别权重越高，越往后识别权重越低

4、尽量使用短句而非单个单词

提示词书写技巧

正向提示词的书写可以根据以下几个大类进行书写

1、内容型提示词

（1）主体

确立画面主体，是人、动物或是其他

然后补充细节（人物形貌特性、面部表情、肢体动作、服饰穿搭等）

例如：a teenager, single, light gray hair, mid split hairstyle, smile, black sweater, white strap, wearing necklace, grey pants, play basketball, slam dunk

（一个年轻人，单人，浅灰色头发，中分发型，微笑，黑色毛衣，白色背带，佩戴项链，灰色裤子，打篮球，灌篮）

（2）场景

可以先确立是室内or室外（indoor/outdoor）；

然后再确立大场景（卧室、客厅、厨房、酒店、教室、沙滩、公园、篮球场、足球场等）

最后在确立画面中出现的其他人或物（花、草、树、木、人、虫、鸟、兽等）

例如：on the outdoor basketball court, audience in the background

（在室外篮球场，观众在背景中）

（3）环境

天气：sunny day（晴天）、rainy day（雨天）、day（白天）、night（黑夜）、morning（上午）、afternoon（下午）、sunrise（日出）、sunset（落日）

光线：bright light（明亮的光线）、gentle light（柔和的光线）、dark （昏暗的）

（4）镜头

wide shot（广角）、distant（远距离）close-up（特写）、full body（全身）、upper body（上身）、portrait（肖像）、view of above（俯视角）、view of back（背面视角）

2、标准化提示词

（1）画面风格

画风：illustration（插画）、painting（绘图）、oil painting style（油画风）、ink style（水墨风）、pixel art（像素风）

二次元：anime（动漫）、comic（漫画）、cartoon（卡通）、game CG（游戏CG）、surrealism（超现实主义）、cyberpunk（赛博朋克）

写实风：photorealistic（照片真实感）、realistic（真实感）

（2）提升画质

masterpiece（杰作）、high quality（高质量）、hires（高分辨率）、ultra-detailed（超详细的细节）、insanely detailed（极其详细的细节）

（3）特定渲染引擎

extremely detailed CG unity 8K wallpaper（超精细的8K Unity游戏CG）、unreal engine rendered（虚幻引擎渲染）、octane render（octane渲染器）

负向提示词一般写一些不想画面出现的内容，通常这里都是列举一些典型的邪典元素，例如多头、多手、多手指等，也可以写一些有关低画质的提示词，反向辅助画质提升。

下面是一些常用的负向提示词

（1）降低粗糙画质

worst quality、low quality（低质量）、lowres（低分辨率）

monochrome（单色图）、grayscale（灰度图）

（2）降低错误画面

NSFW（not safe for work：不适合上班浏览的内容，懂的都懂）

disfigured（毁容）、ugly（丑陋）、morbid（病态的）、mutilated（残缺的）、blurry（模糊不清的）、tranny（变性者）、duplicate（重复的）、extra digit（多余的数字）

bad anatomy（差的结构）、bad proportions（差的比例）

age spot（老年斑）、skin spots（皮肤斑点）、skin blemishes（皮肤瑕疵）、acnes（痤疮）、unclear eyes（不清晰的眼睛）、extra limbs（多余的肢体）、extra arms and legs（多余的手臂和腿）、missing arms（消失的手臂）、missing fingers（消失的手指）、too many fingers（过多的手指）、fused fingers（合并在一起的手指）、mutated hands（变形的手）、bad hands（坏手）、poorly drawn hands（画得不好的手）

以下就是通过上述方法绘制的一张样图：

是不是感觉还不错呢，这里附上该图的提示词供大家参考。

**正向提示词：**a teenager, single, light gray hair, mid split hairstyle, smile, black sweater, white strap, wearing necklace, grey pants, play basketball, slam dunk, on the outdoor basketball court, audience in the background, outdoor, sunny day, morning, gentle light, close-up, view of above, oil painting style, anime, masterpiece, high quality, hires, ultra-detailed

**负向提示词：**NSFW, worst quality, low quality, lowres, monochrome, grayscale, disfigured, ugly, morbid, mutilated, blurry, tranny, duplicate, extra digit, bad anatomy, bad proportions, age spot, skin spots, skin blemishes, acnes, unclear eyes, extra limbs, extra arms and legs, missing arms, missing fingers, too many fingers, fused fingers, mutated hands, bad hands, poorly drawn hands

**总结：**提示词书写的详尽与否，与最终的画面呈现有着密不可分的关系。具体请根据生成画面内容不断地调整提示词以达到理想画质。

提示词的权重

提示词权重就是指示AI识别提示词的强弱程度。权重越高，AI参与识别的程度就越高，反之识别程度就越低。

调整权重的方式：

1、括号法

（1）圆括号：每套一层，权重增加×1.1倍

例如：((gray hair)) ，权重=1.1×1.1=1.21倍（增强）

（2）大括号：每套一层，权重增加×1.05倍

例如：{{gray hair}} ，权重=1.05×1.05=1.1025倍（微增强）

（3）方括号：每套一层，权重增加×0.9倍

例如：[[gray hair]]，权重=0.9×0.9=0.81倍（削弱）

2、数字法（推荐）

(gray hair:1.25)，权重=1.25倍（增强）

(gray hair:0.75)，权重=0.75倍（削弱）

权重默认值为1，数值**>1时，权重增强**；数值**<1时，权重削弱**。

权重数值建议区间：0.5~1.5（太高或太低会导致画面变形）

提示词进阶语法

1、混合

（1）AND法

chicken AND basketball（鸡和篮球混合）

（2）|法（shift+enter上面的键）

chicken|basketball

交替算法

1、3、5、7、9渲染chicken

2、4、6、8、10渲染basketball

2、渐变

[chicken🏀0.75]

进程达到75%之前生成鸡，75%之后生成篮球

采样方法（Sampler）

**采样方法（Sampler）**通俗的讲就是AI生成图像过程中采用的方法。

那么，这么多采样方法，究竟该选哪一个呢？

根据不同的需求，以下是一些选择采样方法的建议：

（1）如果你想快速生成新颖且质量不错的图像，那么你可以选择DPM++ 2M Karras或者UniPC，二者迭代步数均设置在20~30之间；

（2）如果你想生成高质量的图像并且不在意画面内容的稳定性，那么你可以选择是DPM++ SDE Karras（注：这是一个较慢的采样器），或者是DDIM，二者迭代步数均设置在10~15之间；

（3）如果你喜欢想生成稳定的图像，那么不要选任何祖先采样器（即名字中带字母a的采样方法）；

（4）如果你想生成较为简单的图像，那么你可以选择Euler或者Heun。Heun生成速度较慢，可以通过减少 Heun 的迭代步数来节省时间。

迭代步数（Steps）

**迭代步数（Steps）**就是采样渲染图片的次数。

数值越高，画面细节越多，相对的渲染时间也会越长；数值越低，画面细节越少，相对的渲染时间也会越短。

数值默认20，建议范围20~40之间，一般最低不低于10。

面部修复、平铺图、高分辨率修复

**面部修复：**渲染人物面部时勾选，有助提高AI对人物面部细节的处理。

**平铺图（Tiling）：**主要用来做纹理贴图，一般情况下不勾选。

**高分辨率修复（Hires.fix）：**把模糊的图片变高清，一般情况下不勾选。

宽度、高度

图像分辨率调得越高，生成图像时占用的显存越多。分辨率调得太高，不仅速度慢，容易爆显存，报错，更容易出现多人、多头的邪典画面。因此一般初稿不建议调太高，分辨率可以后期调整。

常用的图像分辨率有：

1:1——512×512px、768×768px

3:2——768*512px

4:3——512×384px、768×576px

16:9——512×288px、768×432px

16:10——512×320px、768×480px

总批次数、单批数量

**总批次数：**总的需要生成图片的批次数量

**单批次数：**单一批次内同时生成的图片数量

例如：

总批次数为3，单批次数为2

那么同一个批次会同时生成2张图片，该批次处理完成后会进入下一批次，一共会重复进行3次这样的操作，最终会得到6张图像。

单批次数调得越高，越容易吃显存。因此显存低的话不建议把单次调高（保持默认1即可），把总批次数调高同样可以达到批量生成的效果。

提示词引导系数 (CFG Scale)

**提示词引导系数（CFG Scale）**就是提示词和生成图片的相关度。

数值越高，提示词和图片的关联度就越高；

数值越低，提示词和图片的关联度就越低，但AI想象力会更加丰富。

引导系数理想的数值范围为7~12。

随机数种子（Seed）

随机数种子（Seed）的默认值为-1，它代表着SD的每一次的图像生成都是随机的。（右侧骰子按钮为重置数值为-1）

SD每一次的图像生成都会赋予图像一串种子编号，可在右侧下方的信息框中找到该图像的种子编号（在下图中框选位置找到）。

当得到一张还不错的画作，想要延续该图像的风格继续创作时，复制种子编号，粘贴至随机数种子的方框中，或者点击右侧绿色循环按钮直接调用上一次出图的种子编号。

右侧选框勾选，开启变异随机种子功能（不常用），它的作用就是融合两个不同种子的风格，变异强度越高，图像风格越接近变异种子，反之越接近上面那个种子。

早点开启AI学习，给自己的人生来个翻天覆地的变化吧！

如果你也对AI技术感兴趣感兴趣，可以下方扫码免费领取一份AI技术入门资料包wx扫描二v码免费领取【保证100%免费】

在这里插入图片描述

在可预见的未来，随着AI大范围在职场推广，使用门槛降低，部分还在做重复工作的打工人会不可避免地被取代。

这也是为什么身边越来越多人都在学AI。

负责任地说，这是AI离普通人超近的一次。它——

很简单： 只要你有一个浏览器，登录一个网页，会打字、会聊微信就能够直接使用。
很实用： 任何上班族，无论你的工作涉及文字、图片、数字，或是办公软件全家桶，它都能成为你的高效助理。
很聪明： AI如同一个六边形战士，当你有个绝妙点子，它能随时点亮技能树，用编程、写作、绘画技能把你的想法落地。

随着人工智能的推广，具备AI技能的人将更容易适应未来岗位需求，成为早期吃到红利的稀缺人才。