Al绘画小白福音！StableDiffusion保姆级教程

最新推荐文章于 2024-09-15 15:29:29 发布

网安福宝

最新推荐文章于 2024-09-15 15:29:29 发布

阅读量966

点赞数 19

分类专栏： AI绘画 SD教程文章标签： stable diffusion 人工智能 AI作画 AI绘画 AIGC

本文链接：https://blog.csdn.net/WANGJUNAIJIAO/article/details/141185589

版权

AI绘画同时被 2 个专栏收录

202 篇文章 5 订阅

订阅专栏

SD教程

183 篇文章 1 订阅

订阅专栏

上一篇文章，我们介绍了AI绘画模型的类型，并且安装好了模型，今天，我们就来进行 AI 绘画的文生图实战。

文生图实战

模型安装后之后，就可以开始激动人心的 AI 文生图了，下面我们以文生图为例，一边操作一边讲解提示词的语法和分类，以及出图参数的作用和使用方法。

在开始之前，我们再来回顾一下，我们的需求是让 AI 生成我们所要求的图片。

图片风格由模型本身和提示词决定，不同模型擅长生成不同风格的图片；而图片内容由我们的提示词决定，正向提示词会让图片展示对应内容，也会影响画质，反向提示词会让图片不生成什么内容；同时，提示词也可以分为内容提示词以及画质和画风提示词可以帮助我们将我们需要的图片更加具体准确的描述出来；而出图参数决定生成图片的大小，数量，质量等。

OK，下面是一个实际案例，通过文字来生成二次元图片。

我选择了大模型「cetusMix_Version3.5」，vae 选择的是「kl-f8-anime2.ckpt」，这是一个比较通用的二次元 vae 模型。

接下来需要输入提示词让 AI 知道你想要画的内容是什么，所以，我们这里先介绍一下提示词的概念、分类和语法。

提示词概念

什么是提示词 (prompt) ？广义地解释，Prompt 是指用户输入的文本或图像信息，目的是指导模型根据一些特定的需求生成艺术作品，翻译过来就是你告诉 AI，你想要画的内容是什么，画成什么样的一种语言。之前我们提到过，AI 绘画的两种基本形式是文生图和图生图，文生图主要通过文字来传递信息，而图生图则是通过图片和文字一起来传递信息。

提示词包括的内容，是非常广泛的，它可能包括作品主题、画风、形象特点以及一些具体包含的要素，不同的提示词分别向AI描绘了画面风格、人物体貌、服饰特点、场景内容和一些额外的修饰性元素。下面我们介绍一下提示词的分类。

提示词分类

提示词按正向反向可以分为正向提示词和反向提示词，正向提示词的内容是你需要图片生成出来的，而反向提示词的内容是你不想让图片出现的，反向提示词一般用通用提示词就可以了，是为了避免AI 绘制出，低质量，丑的，多手指，少手指等情况出现。。

提示词按内容和画质可以分为两个大类，内容提示词和画质画风提示词，两个大类下面又各有几个小类；。

内容提示词

人物及主体特征

服饰穿搭
发型发色
五官特点
面部表情
肢体动作

场景内容

室内、室外
大场景
小细节

环境光照

白天黑夜
特定时段
光环境
天空

画幅视角

距离 close-up,distant
人物比例 full body,upperbody
观察视角 from above, view of back
镜头类型 wide angle,Sony A7

画质和画风提示词

通用高画质 bestquality,ultra-detailed,masterpiece,hires,8k
特定高分辨率类型 extremelydetailedCGunity8kwallpaper（超精细的8KUnity游戏CG），unrealenginerendered（虚幻引|擎渲染）
插画风 illustration,painting,paintbrush
二次元 anime,comic,gameCG
写实系 photorealistic,realistic,photograph

通用模板

下面给出一个通用模板。

提示词语法

基本语法

提示词需要用英语来书写；
以词组为单位，不需要完整的句子。
通过英文半角逗号「,」来分隔提示词。

提示词权重

给提示词加权重，一层原括号是1.1倍，两乘括号就是1.1乘以1.1等于1.21倍；比如 (red ball), ((blue ball)) 。同样的，大括号是1.05倍，方括号是0.9倍。

你也可以在直接在括号中对给提词词加一个冒号，输入数字的权重；比如 (yellow flower:1.5) 。

注意一个词条的权重不能太高，安全范围是0.5到1.5；太高的话，容易毁坏整个画面。

进阶语法

进阶语法对于新手来说基本用不到，之后有机会单独讲解。

ok，那讲解完这些概念之后，我们开始真正的输入提示词，先输入正向提示词，其实也很简单，你可以按照我给出的提示词模板，从下往下一个一个去输入即可，这里我输入的是：

1girl, solo focus, tall female, grey hair, very long hair, purple eyes, large breasts, wide hips, sharp face, jewel-like eyes, serious, tired, wearing long grey coat, black blazer, black legwear, stylish sneakers, accessories, smartwatch, flower hair ornament, cute smile, sitting, cafe, coffee shop ambience, coffee shop aesthetic, snow on window, dawn, window view, massive cityscape, beautiful view, dim-lit ambience, holding coffee, {correct posing}, {detailed clothing}, {detailed body}, {correct body anatomy}, {extremely beautiful and delicate anime face and eyes}, {minute details}, {intricate details}, {delicate}, (masterpiece), (best quality), (wallpaper), (8k hd),

然后输入反向提示器，这个一般是有模板的，可以参考其他大佬的，这里我输入的是

extra fingers,fewer fingers,(low quality, worst quality:1.4), (bad anatomy), (inaccurate limb:1.2),bad composition, inaccurate eyes, extra digit,fewer digits,(extra arms:1.2), easynegative

输入好提示词后，就需要输入出图参数来控制图片质量，大小，生成数量等，下面详细介绍一下出图参数。