只要单身到30岁就可以像我一样成为大魔法师了（AI-Stable Diffusion Prompt咒语篇）

最新推荐文章于 2024-09-06 17:13:34 发布

网安福宝

最新推荐文章于 2024-09-06 17:13:34 发布

阅读量397

点赞数 3

分类专栏： SD教程 AI绘画文章标签： stable diffusion 人工智能 AI作画 AIGC AI绘画

本文链接：https://blog.csdn.net/WANGJUNAIJIAO/article/details/140818494

版权

AI绘画同时被 2 个专栏收录

193 篇文章 4 订阅

订阅专栏

SD教程

177 篇文章 1 订阅

订阅专栏

昨天我好好地研究了一下Stable Diffusion所生成的图片，不是那种一张一张略过的看法，而是仔细端详了一番，直到我的哈喇子滴在了键盘上。

图片来源：NGA社区

在这个帖子下面的评论区中多数大佬都说什么看腻了，有没有新鲜的东西之类的。

这让作为刚刚接触AI绘画世界的我来说大为震撼，难道画的这么好的图有很多吗？直到我看到了下面还有一个人发了一张图。

我靠？周淑怡？？？

难不成AI绘画的尽头是周淑怡？

这不由得勾起了我的好奇心，到底什么样的情况下才会让AI认为周姐是美女呢？

紧接着我就在论坛上看到大佬们讨论各种词条、魔法咒语、Prompt之类的，这让我想起了之前学习Mid Journey时的那些prompt，那些词条大多都是用于改善图片质量的。

在Stable Diffusion中也是同理，AI还没有进化到能读取我脑里面信息的阶段，要是到那个阶段估计现在警察已经在敲我的门了。

Prompt也就是提示词可以让AI更好的了解我的需求，之所以被称为咒语是因为其词条与词条之间密集且都是英文，看着就很像哈利波特那种咒语。

这篇笔记会用Stable Diffusion的文生图功能来辅助了解提示词这个知识点，当然对于Mid Journey来说提示词这种东西在大方向上是共通的。

让我们废话少说，直接SD启动！

提示词的基本概念

虽然已经了解了但是我还是跟着视频教程学习一下什么是提示词。

Stable Diffusion的文生图功能中的文指的就是文本，也就是提示词Prompt，用教程原话来讲：

Prompt是指用户输入的文本或图像信息，目的是指导模型根据一些特定的需求生成艺术品，简单来讲就是用来告诉AI“我要画什么”或“画成什么样”的语言。

SD里的两者基础的绘制方式就是文生图和图生图，文生图主要靠提示词来生成画面。而图生图虽然也需要文字，但是可以导入图片作为提示词用于辅助AI绘画。

提示词的包含非常广泛，可以是作品的主题（例如要画什么）、画风、形象特点等一些具体要素。

例如人物形象和服饰、画质标准化、环境光照、氛围修饰等。

虽然说提示词不是说越多越好，但是大部分情况下更多的提示词生成的效果会符合自己想要的样子，不确定性会更小。

谁不想要一个符合自己心目中的女神呢？

提示词的书写

在之前有提到过提示词的都是用英文来写的，如果英语水平足够好的话可以直接用英文来写出自己的需求例如白毛white hair、黑丝Black silk、惊喜Surprise等等。

如果觉得自己的英文表达能力可能没那么准确，那么直接用翻译软件就可以了，

其次提示词是以词组为单位的，并不需要像英文句子需要完整的语法结构

就像是想要跟AI说“你好，我是秦始皇。其实我并没有死，徐福的不死丹是真的！只要你VX转我500块我就把不死丹分享给你，顺便再册封你做我的大将军！”

在写提示词时候就可以简单地写“我，秦始皇，打钱”，这样AI也可以听得懂。

词组与词组之间是需要插入分隔符的，基本的分隔符形式就是英文的逗号加上一个空格。

提示词可以换行，例如第一段是描述人物、第二段描述环境等，不过都最好打上分隔符也就是英文输入法里的逗号。

AI生成的东西是具有随机性的，即便是一段完全相同的提示词每次出来的结果都会不一样。

大部分情况下一段简单的提示词无法让AI清楚地知道需求，太过笼统的提示词就像是让AI抽卡了，能不能出现想要的画面就说不准。

所以提示词都不是一下子就能写好的，而是在不断地绘画过程中补充、细化、改良。

提示词的分类

提示词具体上分为几大类别：

首先是内容型提示词

**基于人物及主体特征-**像是服饰穿搭、发型发色、五官特点、面部表情、肢体动作，例如：white dress, blonde hair, long hair, smiling face, stretching arams, hands up
场景特点-像是室内还是室外、大背景是什么样的（城市、森林、街道）、小细节（车水马龙、都是树木、干净的街道），例如trees, bush, white flower, path (如果是室外或者室内最好把outdoor或indoor加上去，因为会显著影响画面氛围）
环境光照-像是白天黑夜、特定的时间段（中午还是早上）、光环境（背光、太阳光）、天空（蓝色的天空、灰蒙蒙的天空），例如：day, sunlight, blue sky, cloudy sky.
画幅角度-像是一些人物距离镜头的距离、人物的臂力、观察的视角、镜头的类型，例如close-up, upper body, view of back, wide angle.

只有内容型的提示词是不够的，因为作品的表达会很模糊，也没有什么细节。

其次是标准化提示词

AI绘画有些是会比较模糊有些会十分高清，所以画质提示词可以帮助AI将该清晰的地方清晰。

**通用高画质：**best quality最高质量,ultra-detailed超级细节, masterpiece杰作, hires高分辨率, 8k（分辨率）

特定高分辨率类型: extremely detailed CG unity 8k wallpaper(超精细的8K Unity有游戏CG), unreal engine rendered(虚幻引擎渲染)

画风提示词: illustration,painting,paintbrush（插画风）、ainme, comic,game CG（二次元）、photorealistic, realistic, photograph(写实系)，不过要注意的是真实系的创作更依赖于真实照片训练的模型。

之所以被称之为标准化提示词，是因为这些提示词可以让画面更趋近于某个固定的标准，加了这类提示词后可以提升画面的细节和质感。

在这里我按照原教材抄写了一段通用模板，感兴趣的可以直接复制了然后自行对某一部分进行更改

描述人物→ (1girl:2.0), solo, nilou (genshin impact), solo, long hair, jewelry, blue gemstone, earrings, horns, crown, cyan stain strapless dress, white veil, neck ring, red hair, {green eyes},、
描述场景→indoor, room, house, sofa, wooden floor, plant, flower, trees, windows,
描述环境→day, morning, sunlight, dappled sunlighty, backlight, light rays, cloudy sky
描述画幅视角→full body, wide angle shot, depth of filed
其他画面要素→ light particles, fantasy, wind blow, maple leaf, dusty
高品质标准化→{{masterpiece}}, {best quality}, {highres}, original, reflectionm unreal engine, bodyshadow, artstation extremely detail CG unity 8k wallpaper,
画风标准化→(illustration), (painting), (sketch), anime coloring, fantasy,
其他细致要求→exaggerated body proportion, greasyskin, realistic and delicate facial features, SFW,

内容型提示词往往会根据想要创作的内容而改变，当只是需要微调的时候提示词词组就可以很方便，只需要找到对应的词组然后更改就可以。

只要想创作的是二次元的高质量插画，就可以用下面这个原课程提供的标准化提示词组

(masterpiece:1.2), best quality, masterpiece, highres, original, extremely detailed wallpaper, perfect lighting, (extremely detailed CG:1.2), drawing, paintbrush,

提示词的权重

在上面那段提示词中可以看到masterpiece后面跟着一个1.2这样的数字，这些括号内容及其后面的数字是用于增强或者减弱某些提示词的优先级和权重的。

在大部分情况下，一个完整的AI绘画会需要到很多提示词，而AI在绘画的过程中则需要处理许多提示词。画面的大小是有限的，AI不确定哪一个元素是优先级最高的。

例如我在提示词里写了花，我想要的效果是角色沐浴在花海中，而AI不知道，所以只给角色头上插了一朵花，而优先将树林天空等其他要素画好。

提高词组优先级的方式有两种，第一种是加括号，例如将flower变为(flower)，这样这个词组的权重就变为原来的1.1倍。每套一次括号，其权重就会是原来的1.1倍，套3层就是1.331倍(((flower)))。

另一种方式是括号加上数字权重，加了一个括号之后可以在其英文字符后面加上一个英文的冒号以及一个数字。例如(flower:1.5)，这样其权重就是原来的1.5倍。

**图片来源:**20分钟搞懂Prompt与参数设置，你的AI绘画“咒语”学明白了吗？| 零基础入门Stable Diffusion·保姆级新手教程 | Prompt关键词教学_哔哩哔哩_bilibili

加数字的方式可以比较精准地调节权重，而加括号的方式则可以在微调的时候更加方便。

当想要削弱某个词条的权重时，就在其后面赋予一个小于1的权重数值。

要注意的是，在调节权重的时候要注意不要让某个词组权重过高，比较安全的调整范围在1上下0.5左右，某个词条如果权重过高容易扭曲画面内容。

词条还有进阶的语法

混合：white | yellow flower,用于混合两个描述同一对象的提示词要素。在这里用于生成黄色和白色混合的花。
迁移：[white|red|blue] flower, 用于连续生成具有多个不同特征的对象，不断迁移。在这里用于先生成白花，再生成红花，再生产蓝花。
迭代：(white flower: bush:0.8), 用于与采样进程关联，一定阶段后再生成特定对象。在这里是当进程达到80%(0.8)之前生成白花，80%之后再生成灌木。

负面提示词

在一篇笔记中提到过正向提示词用于想要AI画出来的东西，而负面提示词则是不希望AI画出来的东西，反向提示词可以放空白，不过一般情况下会加入一些通用的提示词。

例如上篇笔记里的：

(worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality，等都是为了杜绝低质量的学习样本

((monochrome)), ((grayscale))是单色的、灰度的，为的是保持画面的色彩鲜艳；

(bad proportions:1.331),是为了避免畸形的身材比例

bad hands, missing fingers, 是为了避免之前说AI画手部的时候会少手指或者多手指等不正常现象。

出图参数

除了上述的提示词咒语以外，在下方还有一个出图参数的设置。

采样迭代步数，AI一般生成图像会经过一个加噪再去噪的过程。

**图片来源：**20分钟搞懂Prompt与参数设置，你的AI绘画“咒语”学明白了吗？| 零基础入门Stable Diffusion·保姆级新手教程 | Prompt关键词教学_哔哩哔哩_bilibili

下面这个图可以更好地理解这个加噪再去噪的过程

画面每闪烁一下就代表了迭代一步

理论上采样迭代步数越多，其最终效果就越清晰，但实际上步数大于20以后的提升其实并不大。

一般的默认采样步数是20，因为越多的步数意味着越多的采样时间。

采样方法

采样方法可以理解为AI进行图像生成时使用的某种特定算法，虽然说WebUI提供了很多采样方法，但是常用的也就那么几个。

其中的Euler a和Eular出图比较朴素，适合插画风格

DPM 2M和2M Karras速度较快

SDE Karras细节会较为丰富

当然最终效果取决于提示词，上述的不一定完全正确，肯定还是以自己尝试的结果为准。但是下方几个带有+号的是改进后的算法，会相对稳定些。

不过大部分的模型在下载时都会有推荐使用的某一特定算法，这类算法都是模型制作者自己测试过的。

分辨率

下方的宽和高就是代表着出图的分辨率，分辨率的设置存在一些隐性限制。默认的是512512，但是这个分辨率看着会比较模糊，所以一般情况下10241024会更好些。

分辨率受限于显卡的显存，分辨率太大了也会出现多人多手脚的情况，其原因在于AI进行模型训练的时候用的图片分辨率一般都比较小，如果分辨率太大AI会认为是多张图片拼接而成。

所以一般情况下会采用低分辨率绘制后再用**高清修复(Hires Fix)**的方式来放大，本质上是进行了一次额外的图生图。

至于面部修复则是会采用一些对抗算法识别人物面部并进行修复，和那种app里面的智能P脸差不多。

平铺图用于生成无缝贴满整个屏幕的纹理性图片，一般不勾选。

提示词引导系数

而提示词引导系数比较好理解，数值越高AI能忠实地反映提示词的程度就越高，7-12是比较安全的数值。

随机种子

随机种子则是用于控制画面内容一致性的重要参数。

总批次和单批数量

因为AI绘画的不确定性，即便是同一组提示词也需要反复实验生成才有可能达到自己想要的效果。

如果想要让AI按照一组提示词不断地去反复出图，那么就把总批次数提高，绘制过程会不断进行，在结束之后会生成两样东西。

除了每个批次生成的图以外，还会有一张将所有批次的图拼接在一起的图片。

当然可以选择几百几千次，然后去睡觉休息会让显卡搁着吭哧吭哧地给你画图，最后在图库中挑一张自己喜欢的进行细化。

下方的单批数量一般不建议调整，增大这个选项可以让每批次绘制的图像数量增多，但是其绘制方法是将这些图拼在一起看做是一张更大的图进行绘画，如果设备不够好，可能把显存给爆了。

高贵的24GB 4090用户可以忽略我刚刚说的。

虽然说今天的知识点看着都很复杂什么提示词参数啥的，但是对于像我这样新手来说原课程也提供了几个适合新手的小技巧。

1、善用翻译

提示词看着再怎么复杂终究还是人话，当不知道该怎么表达自己的想法的时候，可以用自然的语言去把想画的东西一个一个说出来，不会写的就用翻译软件就可以。就先描述一个确切的场景，再将想要补充的东西一个一个翻译成英文放进去。

2、借助工具

提示词难写估计也不是一天两天的事情，有些大佬就专门开发了一些可以帮助新手更好地去书写提示词的工具。

这里有两个可以辅助提示词书写的网站，第一个是一个工具箱：

AI绘画提示词生成器 - 一个工具箱 - 好用的在线工具都在这里！(atoolbox.net)

另一个是AI词语加速器：AI词汇加速器 AcceleratorI Prompt (dawnmark.cn)

可以在网站上选择自己需要的参数，然后网站可以自动按照语法规则将这些参数整理到一起，之后再复制粘贴进SD就可以。

3、抄作业

在AI绘画领域里，抄作业并不是一件不光彩的事情，在一些模型网站例如Civitai上，创作者会主动分享自己作图时使用的咒语和模型。

这里也有两个可以搜索记录提示词的网站，第一个是Openart.AI：https://openart.ai/

这个网站记录SD和欧美流行的模型比较多。

另一个是ArtHubAi:https://arthub.ai/

这个网站记录二次元和亚洲审美的内容比较多。

当然抄作业也不是要你照抄，而是在看的时候例如说喜欢这幅作品的某个元素，就可以在创作者展示的提示词中找到对应的部分。

今天的内容到这里就结束啦！

说实话还是学到了很多的，像是咒语部分我在Mid Journey虽然已经学了一部分，但是今天的很多内容对于我来说都是新的知识点。

当然我废话也不多说了，就在文末放一幅我今天学着练出来的图，提示词我就都放在下方了。

关于AI绘画技术储备

学好 AI绘画不论是就业还是做副业赚钱都不错，但要学会 AI绘画还是要有一个学习规划。最后大家分享一份全套的 AI绘画学习资料，给那些想学习 AI绘画的小伙伴们一点帮助！

对于0基础小白入门：

如果你是零基础小白，想快速入门AI绘画是可以考虑的。

一方面是学习时间相对较短，学习内容更全面更集中。
二方面是可以找到适合自己的学习方案

包括：stable diffusion安装包、stable diffusion0基础入门全套PDF，视频学习教程。带你从零基础系统性的学好AI绘画！

需要的可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

1.stable diffusion安装包（全套教程文末领取哈）

随着技术的迭代，目前 Stable Diffusion 已经能够生成非常艺术化的图片了，完全有赶超人类的架势，已经有不少工作被这类服务替代，比如制作一个 logo 图片，画一张虚拟老婆照片，画质堪比相机。

最新 Stable Diffusion 除了有win多个版本，就算说底端的显卡也能玩了哦！此外还带来了Mac版本，仅支持macOS 12.3或更高版本。

在这里插入图片描述

2.stable diffusion视频合集

我们在学习的时候，往往书籍源码难以理解，阅读困难，这时候视频教程教程是就很适合了，生动形象加上案例实战，一步步带你入坑stable diffusion，科学有趣才能更方便的学习下去。

在这里插入图片描述

3.stable diffusion模型下载

stable diffusion往往一开始使用时图片等无法达到理想的生成效果，这时则需要通过使用大量训练数据，调整模型的超参数（如学习率、训练轮数、模型大小等），可以使得模型更好地适应数据集，并生成更加真实、准确、高质量的图像。

在这里插入图片描述

4.stable diffusion提示词

提示词是构建由文本到图像模型解释和理解的单词的过程。可以把它理解为你告诉 AI 模型要画什么而需要说的语言，整个SD学习过程中都离不开这本提示词手册。

在这里插入图片描述

5.AIGC视频教程合集

观看全面零基础学习视频，看视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。

在这里插入图片描述

实战案例

纸上得来终觉浅，要学会跟着视频一起敲，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。
在这里插入图片描述
这份完整版的学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

网安福宝

关注

3
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
只要单身到30岁就可以像我一样成为大魔法师了（AI-Stable Diffusion Prompt咒语篇）

昨天我好好地研究了一下Stable Diffusion所生成的图片，不是那种一张一张略过的看法，而是仔细端详了一番，直到我的哈喇子滴在了键盘上。
复制链接

扫一扫