一分钟教你成为大魔法师（AI-Stable Diffusion Prompt咒语篇）

AIGC阿道夫

于 2024-07-01 12:04:29 发布

阅读量1k

点赞数 7

文章标签：人工智能 stable diffusion prompt AI作画 AIGC ai 人工智能作画

本文链接：https://blog.csdn.net/text2203/article/details/140097147

版权

大家好我是阿道夫！！
Stable Diffusion，一款基于深度学习的图像生成模型，以其强大的图像生成能力和个性化风格迁移能力，在艺术创作领域掀起了一场革命。而Prompt，作为Stable Diffusion的咒语，能够引导和控制生成图像的方向和风格。本文将带你一分钟掌握Stable Diffusion Prompt的使用技巧，让你轻松成为大魔法师。
在这里插入图片描述

今天我们来聊一聊AI绘画跟咒语有什么关系呢？记得吗，生图的过程中，我们需要向AI输入提示词（Prompt），由于提示词必须是英文书写，很长很乱，而且穿插着各种奇怪的数字、符号，就像是一串一串的咒语一样。因此大家把写提示词这个过程戏称为“念咒”而我们就像魔法师一样，通过“吟唱咒语”来变出我们想要的结果。

虽然说AI是人工智能，但是它人类智慧还是有一定差距的，很多时候它并不知道你想要的是什么。所以这也是为什么“念咒”这件事情在AI盛行的今天慢慢形成了一门独立的可以去探讨、研究的学问。接下来我们进入“咒语”的学习吧。（演示部分为Stable Diffuion）

提示词入门

提示词的概念

当我们产生作画意图需要生成图像时，通过传递需求、描述画面对AI绘画进行指令，这个过程中提示词就起到了一个桥梁的作用。直白点说，它是我们用来告诉AI，我要画什么，画成什么样的一种语言。之前我们提到过文生图和图生图两个概念，文生图主要就是以提示词来沟通需求的，而图生图还能通过图片来传达信息。但图生图里也需要提示词，并且同样重要。

提示词包括的内容是非常广泛的，它可能包括作品主题、画风、形象特点以及一些具体包含的要素。以我绘制过的一张图片为例，它的提示词足足有十几行那么长。不同提示词分别向AI描绘了画面风格、人物体貌、服饰特点、场景内容和一些额外的修饰性元素。别看这么多词，其实很多风格和画质把控的提示词是固定的。

虽然说提示词不是越多越好，但很多时候提示词多点比少写点的效果肯定要好，并且在特定的需求上控制会更加精确。所以想让AI按照我们的需要去产图，提示词到底该怎么写呢？

其实在写提示词的时候是有技巧的，在写提示词的时候把输入法调成英文，英文里面涉及到的符号基本上都是英文。提示词可以换行，但是每一行的末尾要打上分隔符。

内容型提示词

输入好提示词后点击生成，你会发现每次生成的图都不一样，可能效果很好也可能生出古神图。因此有人把AI绘画比喻成“抽卡”。但其实很多时候是因为你的提示词太笼统了，不够具体，因此只需要把提示词慢慢的填充调整。提示词有很多分类，简单概括就是这些：

人物及主体特征：服饰穿搭、发型发色、五官特点、面部表情、肢体动作
场景特征：室内/室外、大场景、小细节
环境光照：白天黑夜、特定时段、光环境、天空
画幅视角：距离、人物比例、观察视角、镜头类型

你也可以加入一些形容词，beautiful、happy等，这些形容词虽然有点抽象，但是在一定程度上对画面是有影响的，如果你想要的是室外的场景最好加上outdoor反之加上indoor，它会很显著地影响整个画面的氛围。

标准化提示词

只有内容型的提示词往往画出来的东西有很大概率不会让你满意的、像这种作品，你会觉得很模糊，细节不够清晰，这里我们就需要添加标准化提示词来给画面提提神。首先是画质，这可以让你的画面往画质高的方向靠。

通用的高画质有：best quality，ultra-detailed，masterpiece，hires，8k
特定高分辨率类型：extremely，detailed CG unity 8k wallpaper（超精细的8kUnity游戏CG），unreal engine rendered（虚幻引擎渲染）

还有一些就是画风提示词。

插画：illuseration，painting，paintbrush
二次元：anime，comic，game CG
写实系：photorealistic，realisttic，photograph

注：写实系的创作更加依赖于真实照片训练的模型

这里提供一下通用模板的提示词，你可以按照这个方式修改里面的每一个细节，让你的画面变得更加符合需要。内容型的提示词是根据你想要创作的而定的，所以每次都需要修改。提示词词组化就可以解决这个问题，当你想要微调的时候只需要修改某个词组就好了。而标准化的提示词是相对固定可以抄作业的，主要你想画的是某种风格的图，就可以把上面的提示词重复利用。

权重与负面提示词

在提示词里往往需要通过符号和数字来影响提示词的权重。比如你输入了提示词胸针，但是它画面没有出现胸针这个物件。这里的原因在于，你输入了很多不同的元素给AI，都要它画，但他在处理的过程中，不一定能get到你最想要的是什么所以可能优先去画了树或衣服。如果你特别想要胸针，就可以通过这种方式来强调胸针：

套括号（）在提示词两侧加上这种圆括号（）,注意是英文半角的括号。它的权重就会变成原来的1.1倍，相对于前天元素就会更突出。你还可以套多层括号，(((提示词)))每套一层就再乘1.1倍。三层就是1.331倍，这个时候你想要的内容可以凸显出来了。
括号加数字权重，加了括号以后加上英文引号(white flower:1.5),比如1.5，就是原来的1.5倍权重

当你觉得画面里你输入了提示词但AI没有把你画出来的时候，就可以借助这些方法来强调。加数字的方式明显准确，加括号就更方便微调，不同的括号强调的倍数也是不同的。而你想要削弱某个提示词的时候，就可以加上一个小于1的权重数值或者用方括号 [提示词]，会把权重削成原来的0.9倍。

调整权重的时候注意，不要把个别词条的权重调的太高，尽量保持在1±0.5左右。当你设置了个别2左右甚至更高的数值时，画面就很容易扭曲。

这里还有一个进阶的语法，简单提一下，之后再单独拿一个篇幅来讲。

提示词另外一个重要部分，就是反向提示词。通俗点说，你希望这个画里出现什么，就往正向提示词里丢，不希望它出现什么，就往反向提示词里丢。反向提示词是可以没有的，但一般我们也会加入一些通用的项目，主要也是基于图片的标准化。

出图参数设置

如果说提示词是咒语，那么下面的出图参数就像是魔法师的魔杖和魔导师一样，控制了咒语的具体释放形式。

看到这一大堆参数，是不是感觉眼睛都要花了，别担心，我们来梳理一下：

采样迭代步数

我们之前说过了，AI生成图像的过程是加噪再去噪。去噪的过程就是用像素点去模拟你最终想要生成的图像，每模拟一次，画面都会变得更清晰。也就是在AI生成图片时一闪一闪的过程。理论上来说，迭代步数也高，画面最终效果肯定清晰。实际上，当步数大于20以后，就变化不大了。所以一般都是默认20步采样步数

采样方法

其实可以简单解释成AI进行图像生成的时候使用的某种特定算法，WeBUI的算法选项非常多，足足有十几个，但是我们常用到的估计也就4~5个。这其中，Euler的两个适合插画风格，出图比较朴素。DPM 2M和2M Karras速度比较快，DPM Karras细节会较为丰富。这些评价并不一定准确，也会跟提示词和模型的不同产生差别。实际使用时推荐最下面带有+号的，它们是改进过的算法，无论如何都比上面的稳定。

大部分模型都会推荐使用具体的某个采样方法，比如下方

宽和高

代表的是最终你出图的分辨率，分辨率的设置存在一些隐性限制，默认的分辨率是512x512。但是这个分辨率的图哪怕细节再丰富，看起来可能都是很模糊的。设备允许的情况下，一般把分辨率提到1000左右。相同的提示词，分辨率不一样，跑出来的图质感差别是不是就完全不一样了。

但是分辨率吃显卡显存的，如果调得过高，就会出现爆显存的情况。还可能出现一张图片里多手多脚，多人的情况。这个是因为训练的模型一般都是512x512的图，你的分辨率过高，AI就会想办法多放一点内容来填满画面。为了避免这种情况，我们一般生成的时候先用低分辨率的生成，再使用高清修复（Hires Fix）来放大。这个在前几期里面有讲过，想要了解深入的可以往前翻翻。

面部修复

旁边的面部修复一般都会够选上，它会采用一些对抗算法识别人物面部并进行修复，和我们用的美图app里的智能瘦脸差不多。

平铺/分块（Tiling）

平铺是用来分成那种无缝贴满整个屏幕的纹理性图片的，如果你没有需要，千万别勾，会让你的画面变得很奇怪。

提示词相关性（CFG Scale）

提示词相关性越高，AI对提示词反馈的程度就越高。但和权重一样，我们一般不会浮动太多，7~12之间是比较安全的数值。太高容易变形。

随机种子

这个是用来控制画面内容一致性的重要参数，下期再细讲这个。

生成批次和数量

因为AI绘画的不确定性，即使是同一组提示词，你也需要反复试验。如果你想让AI按照同一组提示词和参数不断出图，那就把批次调高，绘制的过程会不断重复。它会生成你设定的批次数的图和对比图，可以批量生成再挑其中满意的细化。但是每批数量不建议挑高，配置不好容易爆显存。

新手必备提示词方法

讨论了那么多的提示词，我们再来聊聊新手写提示词方面取巧的方法，新手写提示词一共分为三种方法：

翻译大法

无论提示词再怎么复杂，其实表达的都是人话，只需要把你想画的东西一件一件说出来就好了。还是那句话，SD不认中文，你得用翻译软件把它转为英文，比如这样。

借助工具

AI绘画的提示词难写大家都知道，所以国内大佬已经把辅助书写提示词的网站（ai.dawnmark.cn/）做出来了。它的用法很简单，你可以像选参数一样，勾选你需要的，它会自动帮你整理，然后你复制粘贴到自己的SD就可以了。

抄作业

在AI绘画里抄作业是很正常的事，在一些模型网站和绘画分享网站上，很多创作者会把自己使用过的咒语和模型分享出来，帮助大家获得类似的效果。这里推荐两个用来搜索提示词的网站，一个是Openart.AI，里面有很多基于SD官方模型和欧美主流模型生成的作品。另一个网站记录的二次元作品和亚洲审美的内容更多一点。不过大家抄作业的时候记得筛选一下，如果你想要画面里内容型的部分就复制内容型的提示词，如果只是喜欢画风或者画质什么的就抄标准化的部分。

这三种方法梳理下来，写提示词是不是就简单多了。

资料软件免费放送

次日同一发放请耐心等待

关于AI绘画技术储备

学好 AI绘画不论是就业还是做副业赚钱都不错，但要学会 AI绘画还是要有一个学习规划。最后大家分享一份全套的 AI绘画学习资料，给那些想学习 AI绘画的小伙伴们一点帮助！

感兴趣的小伙伴，赠送全套AIGC学习资料和安装工具，包含AI绘画、AI人工智能等前沿科技教程，模型插件，具体看下方。

需要的可以扫描下方CSDN官方认证二维码免费领取【保证100%免费】

在这里插入图片描述

**一、AIGC所有方向的学习路线**

AIGC所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照下面的知识点去找对应的学习资源，保证自己学得较为全面。

在这里插入图片描述

二、AIGC必备工具

工具都帮大家整理好了，安装就可直接上手！
在这里插入图片描述

三、最新AIGC学习笔记

当我学到一定基础，有自己的理解能力的时候，会去阅读一些前辈整理的书籍或者手写的笔记资料，这些笔记详细记载了他们对一些技术点的理解，这些理解是比较独到，可以学到不一样的思路。
在这里插入图片描述

四、AIGC视频教程合集

观看全面零基础学习视频，看视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。

在这里插入图片描述

五、实战案例

纸上得来终觉浅，要学会跟着视频一起敲，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。
在这里插入图片描述
这份完整版的学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

在这里插入图片描述

AIGC阿道夫

关注

7
点赞
踩
31

收藏

觉得还不错? 一键收藏
0
评论
一分钟教你成为大魔法师（AI-Stable Diffusion Prompt咒语篇）

大家好我是阿道夫！！Stable Diffusion，一款基于深度学习的图像生成模型，以其强大的图像生成能力和个性化风格迁移能力，在艺术创作领域掀起了一场革命。而Prompt，作为Stable Diffusion的咒语，能够引导和控制生成图像的方向和风格。本文将带你一分钟掌握Stable Diffusion Prompt的使用技巧，让你轻松成为大魔法师。今天我们来聊一聊AI绘画跟咒语有什么关系呢？
复制链接

扫一扫