一文掌握Stable Diffusion提示技巧，秒变AI灵魂画手

本文链接：https://blog.csdn.net/xzz_777c/article/details/139152109

使用Stable Diffusion生成图像时，都需要prompt。Prompt是众多参数中的一个，也是最重要的一个。如果prompt不完整或构建的不好，生成的图片可能会与你所期望的效果不一致。

本文将从影响输出的参数，有效prompt应具备的特征，强调关键词等三大层面，为您展示构建prompt的关键技巧，并可以了解到一个好的prompt能对生成优质图像产生多大影响。

影响输出的参数

在Stable Diffusion中，有一些参数会影响输出结果。模型对绘图风格有极大的影响，采样器和步数对生成的质量很重要，但prompt决定了输出内容。

基础的Stable Diffusion模型适用于多种用途。但有些模型是针对特定风格专门训练的。例如，“Anything”模型能轻松生成日式动漫风格的图片，而“Realistic Vision”模型则能生成逼真的照片效果。可以从Hugging Face Hub或推荐的Civitai下载这些模型：

Anything:

civitai.com/models/9409…

Realistic Vision:

civitai.com/models/4201…

下载的模型应保存至WebUI安装目录下的models/Stable-diffusion文件夹。下载模型时，除了关注模型自身的版本外，还需留意基础模型版本，常见如SD 1.5和SDXL 1.0。使用不同的基础模型可能导致与Pipeline其它部分的兼容问题，包括对prompt的理解方式。

理论上，扩散模型需要数百步骤才能生成图像。但实际上，扩散模型是一个可以用微分方程表示的数学模型。 有一些方法可以近似求解方程，采样器和步数共同控制如何找到近似解。通常来说，步数越多，结果越准确，但步数的影响取决于所选采样器。一般而言，多数采样器应在20至40步之间，以实现质量和速度的最佳平衡。

Prompt是如何影响输出的呢？ 在每一步中，Stable Diffusion中的U-net会利用prompt指导将噪声细化为图像的过程。在每一步中，Stable Diffusion中的U-net都会使用提示来引导噪声细化成图片。不同模型对prompt的理解各不相同，就像人类对某个词有不同先入为主的观念一样。但普遍原则是，应该以“限制重新解读空间的方式”撰写prompt。让我们通过一些例子来深入探讨这一点。