AI绘画：超全Stable Diffusion详解—— 提示词_stable diffusion 提示词准确性-CSDN博客

本文链接：https://blog.csdn.net/2401_85116933/article/details/142793047

一、提示词

提示词是我们告诉AI“你想知道什么”的快速指南，为了引导用户输入或者帮助用户更好地理解系统功能而设计的语言提示。它通常以文字或语音的形式出现，旨在通过提供特定的关键词、短语或者问题，来引导用户进行下一步的操作或输入，从而使得人机交互过程更加流畅、自然。

1.提示词的结构

（1）常用的结构1：(质量)+风格+主体+细节+其它

质量

质量就是对生成图像的准确性、美观度和细节丰富程度的直接影响。高质量的提示词能够有效指导AI模型，使其生成符合用户期望、具有高艺术价值和细节精致的图像。

高质量的SD提示词通常具备以下特点：

明确性 ：提示词应清晰准确地描述所需的图像内容，包括人物特征、场景布置、色彩、风格等，减少歧义，使AI模型能够明确理解用户的意图。
具体性：越具体的提示词越能够帮助模型生成详细的图像。例如，指定颜色、材质、图案等可以增加图像的丰富度和真实感。
恰当的细节强调：在提示词中使用括号和相应的权重数字来强调某些细节，如“masterpiece:1.5”表示对艺术品质的特别重视。
平衡性：好的提示词需要在细节和控制输出之间的自由度之间找到平衡，既不过于具体而限制了创造力，也不可过于模糊而导致生成图像偏离预期。
创造性：创造性的提示词可以激发AI生成独特且富有想象力的图像，比如结合不同的风格、时代背景或元素。
适应性：高质量的提示词还需要能够根据模型反馈进行调整，以便在生成过程中达到最佳效果。
格式规范：合理的格式有助于模型解析提示词，如使用中括号来表示选项或比例，正确使用这些格式可以帮助提高生成图像的准确性。

常见的质量提示词：

best quality	最佳质量
masterpiece	杰作
ultra detailed	超精细
4K、8K	4K、8K分辨率
UHD	超高清，高分辨率
HDR	更好的曝光：风景照、弱光或背光场景

如果使用的是 SD 1.5 的模型，这些提示词还是很有必要的，而SDXL 模型默认生成高质量的图片。

风格

风格，就是想要一张什么艺术类型的图片，如写真、漫画等。

提示词的风格可以非常多样，它可以涉及以下几个方面：

内容描述：告诉AI模型需要生成什么样的主体，如“一位骑士”，“现代城市风景”，“抽象艺术”等。
艺术风格：指定图片的艺术风格，如“印象派”，“超现实主义”等。
色彩描述：描述期望的颜色搭配，如“暖色调”，“冷色系”等。
构图要求：指导画面布局，比如“特写”，“中景”，“对称构图”等。
情绪与氛围：设定画面的情感基调，如“神秘的”，“欢乐的”等。
细节调整：对某些具体细节的强调，如“细致的纹理”，“高光效果”等。
介入与终止步数：在SD中还可以指定特定元素在生成过程中的介入和终止时间，以此来精确控制画面效果。

风格提示词参考

comic	漫画
anime artwork	动漫作品
3d model	3d模型
line art drawing	线条画
cinematic photo	电影照片
photographic	摄影照片
oil painting	油画
illustration	插画

具体的风格非常多，达到100多种，主要了解主流的就可以了。而各种模型（包括大模型和Lora模型），它们大多已经内置了指定风格，经过特定风格图片的训练，对类似的风格更擅长，比如Anything比较擅长二次元风格、RealisticVision比较擅长真实照片风格。

主体

主体就是想要画个什么，描述主要内容、风格、细节和场景的部分，如：新郎和新娘举办盛大的虚幻、浪漫的中国式婚礼

Chinese style wedding,illusory,romantic,with anime for the groom and bride,grand,

细节

这些描述用于指导模型生成符合用户意图的图像。

细节主要包括以下几个方面：

构图描述：细节涉及到如何描述图像的构图，背景和周边环境，如蔚蓝的天空、棉花糖的白云。用户需要通过实践找出哪些描述方式模型能够较好地理解和执行。
关键词选择：选择精确的关键词对于生成目标图像至关重要，特别是人物的一些特征，指定后差别非常大。例如，某些特定术语如“cowboy shot”可能不被模型理解，导致出现牛仔服装的人物。它可通过在反向提示词中添加“full body”或“closeup”等来避免。
参数调整：通过更改生成图像时的参数，可以对提示词的效果进行微调，比如调整介入和终止步数，以控制提示词的效果强度和介入时机。
迭代优化：生成多张图片后，根据结果来评估和优化提示词，可能涉及更改关键词、调整参数或尝试不同的表达方式。

完整例子：

best quality,masterpiece,ultra detailed,UHD 4K,photographic,1girl,upper body,standing,long black hair,blue eyes, looking at viewer,pink shirt,black skirt,white color stockings,street,road lamp,yellow lighting, raining,cinematic lighting

（2）结构2：角色（能力）+上下文+详细的指令说明+风格+输出格式

角色（必填）:可以给模型提供特定的能力，让它更好解决我们的问题，在声明角色后，最好也描述一些它的能力。

上下文（选填）:可以写背景信息，问题描述等，可以让大模型更加了解你的指令，不然它会去猜测你的意图，给出发散性的答案。

详细的指令（必填）:指令越详细，模型的输入结果和你的预期才会更加一致，多利用下面的技巧。

风格（选填）:风格可以给你的大模型赋能，让输出结果发生质的变化。

输出格式（选填）:输出格式可以是文本，代码，json，markdown或者你自定义的格式等。

和第一个格式对比，其实相差不大，意思都一样。

2.提示词权重

使用权重

权重，是某个提示词在生成图片时的重要程度，细节会更到位。

格式：keyword:factor

keyword是要设置权重的提示词，factor是权重，权重的默认值是1，小于1表示降低权重，大于1表示增加权重。

如强调蓝色凳子，就可以写：blue desk:1.2

权重改变格式：()和[]符号

还可用小括号()和中括号[]来代替，()表示1.1倍，[]表示0.9倍，括号可叠加。

(keyword)= 1.1

((keyword)) = 1.21

[keyword]= 0.9

‍[[keyword]] = 0.81

关键词混合

语法格式：[keyword1 : keyword2: factor]

factor 取值范围为0-1，factor不一样的效果不同。

在这里插入图片描述

二、反向提示词

负面提示词，即填入不想要的元素或特征，在采样过程中避免出现。可用来去除物体、修改特征、修改风格等。比如优化图片：比如用来提升质量：blur，不出现坏手、坏脸：bad fingers、bad face

人物常用的反向提示词：

ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, extra limbs, disfigured, deformed, body out of frame, bad anatomy, watermark, signature, cut off, low contrast, underexposed, overexposed, bad art, beginner, amateur, distorted face

三、提示词工具

纯手写提示词比较费时间，最好借助工具实现。

1.提示词插件：强烈推荐

提示词的插件有很多，这里推荐秋叶整合包默认使用的提示词插件。

https://github.com/Physton/sd-webui-prompt-all-in-one

https://gitee.com/mirrord/sd-webui-prompt-all-in-one

httpsebui-prompt-all-in-on在“扩展”中安装：

在这里插入图片描述

重启SD WebUI 之后，在提示词输入框下方会出现辅助功能。

在这里插入图片描述

也可试试预置词，但在某些模型中可能是无效的。

4.内置工具

Stable Diffusion WebUI中集成了一个工具，在“图像信息”上传一张图片，右侧会显示生成时的一些参数。但它是可被抹除的，所以并不是非常有效。

写在最后

感兴趣的小伙伴，赠送全套AIGC学习资料，包含AI绘画、AI人工智能等前沿科技教程和软件工具，具体看这里。

在这里插入图片描述

AIGC技术的未来发展前景广阔，随着人工智能技术的不断发展，AIGC技术也将不断提高。未来，AIGC技术将在游戏和计算领域得到更广泛的应用，使游戏和计算系统具有更高效、更智能、更灵活的特性。同时，AIGC技术也将与人工智能技术紧密结合，在更多的领域得到广泛应用，对程序员来说影响至关重要。未来，AIGC技术将继续得到提高，同时也将与人工智能技术紧密结合，在更多的领域得到广泛应用。

在这里插入图片描述