前言
Stable Diffusion是一种深度学习模型,它能够根据提示词生成高质量的图像。在Stable Diffusion模型中,提示词起着至关重要的作用,因为它们为模型提供了关于所需输出的指导。本文将探讨Stable Diffusion关于提示词的原理,包括提示词的选择、处理和影响模型输出的因素。通过深入了解这些原理,我们可以更好地利用Stable Diffusion模型生成令人惊叹的图像,并探索其在各个领域的应用潜力。
Stable Diffusion 是一种深度学习模型,它能够根据文本提示生成高质量的图像。这种模型通过训练学习了大量文本与图像之间的关系,从而能够“理解”文本提示并生成与之匹配的图像。
具体来说,Stable Diffusion 的嵌入层(Embedding Layer):这一部分将输入的文本提示转化为模型能够理解的数值表示,即嵌入向量。嵌入层通常使用词袋模型(Bag of Words)或者更复杂的模型如 Transformer 来实现。而Stable Diffusion 的安装颇为复杂,这里可以使用好易智算平台。
提示词原理
基础内容
在使用Stable Diffusion模型时,提示词的正确格式和选择对于生成高质量的图像至关重要。以下是一些关于如何优化提示词的建议和示例:
-
使用英文逗号分隔提示词:确保每个提示词之间使用英文逗号分隔,这样可以清晰地定义每个提示词,帮助模型理解。 示例:
sunset, beach, serene
-
使用换行和结尾逗号:如果提示词较长或者需要分组,可以使用换行来增加可读性,并在每个提示词或组的末尾加上逗号。 示例:
mountain landscape,``vibrant colors,``high resolution,``detailed textures,``featuring a prominent peak,``with a clear blue sky,``and a peaceful river flowing,``in a serene and tranquil setting,
示例
-
控制提示词数量:虽然提示词可以提供丰富的信息,但过多的提示词可能会导致模型混淆。建议将提示词数量控制在75个单词以内,以确保每个提示词都能有效地影响图像生成。 示例:
starry night, city skyline, neon lights, bustling streets, modern architecture
-
权重分配:在提示词前加上括号和数字可以指定权重,越靠前的提示词通常具有更高的权重。如果不指定权重,默认权重为1。 示例:
((majestic)), ( elephant), walking, [through], [ savannah]
-
避免过度堆砌提示词:选择提示词时,应选择最能描述所需图像核心特征的词汇,避免使用冗余或不相关的词汇。 示例:
vintage camera, rustic wooden table, soft natural light
而不是vintage camera, old, retro, rustic wooden table, brown, aged, soft natural light, warm tones, antique
通过遵循这些优化提示词的建议,您可以更有效地指导Stable Diffusion模型生成符合您期望的图像。记住,提示词的质量比数量更重要,选择精准而相关的提示词将有助于模型更好地理解您的意图。
提示词基础
各个符号的意义
在使用Stable Diffusion模型时,各种符号的运用对于精确控制图像生成至关重要。以下是对各个符号意义的详细解释和示例,以帮助您更好地理解和使用这些工具。
-
小括号 (),中括号 [],大括号 {}:
-
尖括号 <>:
- 尖括号 <>:用于调用LoRA(Low-Rank Adaptation)模型,这是一种微调技术,可以用于特定的风格或细节控制。 示例:
<艺术家名:权重>
。在这个例子中,"艺术家名"是LoRA模型的名称,"权重"是一个数值,用于控制该模型对图像生成的影响程度。
- 下划线 _:
-
下划线 _:用于连接单词,使模型将它们视为一个整体,而不是单独的元素。 示例:
chocolate,Cake
和chocolate_Cake
。前者表示巧克力和蛋糕是分开的元素,而后者则表示它们是一个整体的"巧克力蛋糕",这有助于模型更准确地理解和生成图像。
通过巧妙地使用这些符号,您可以更精细地控制Stable Diffusion模型的输出,实现您想要的图像效果。记住,实验和调整是找到最佳提示词组合的关键。
进阶语法
控制提示词的生效时间
- [提示词:0-1数值]
FOREST , LOTS OF TREES ANO STOHES ,[FLOWERS: 0.7]
这个含义是等到采样到百分之70才开始花的采样
- [提示词 :: 0-1数值]
FOREST , LOTS OF TREES ANO STOHES ,[FLOWERS:: 0.7]
这个含义是等到采样到百分之70之后就不再计算花的采样了
- 提示词1 : 提示词2 : 0-1数值]
`[stone : flower :0.7],`
这个含义是前百分之70是石头生效,后百分之三十是花朵进行采样
- [提示词1|提示词2]交替采样
`1GIRL,[red I blue] HAIR,`
在这里插入图片描述
在了解了Prompt的基础内容之后,我们可以使用好易智算平台来试试吧!
在这里插入图片描述
提示词推荐格式
在这里插入图片描述
1. 画质词 + 画风词
首先,让我们来看看那些与画质相关的关键词。
-
masterpiece:1.2 这个词意味着插画作品具有极高的艺术价值和技巧性。1.2可能是指作品的评分或是某种特定的标准,但无论如何,它都强调了作品的卓越品质。
-
best quality 这无疑是对于插画作品最高标准的赞美。它表明作品在细节、色彩和表现力等方面都达到了极致的水平。
-
highres,extremely detailed CG highres指的是高分辨率,而extremely detailed CG则是指 extremely detailed CG(计算机生成的图像)。这意味着作品中的每一个细节都经过精心雕刻,甚至连头发丝都能清晰地看到。
-
perfect lighting 完美的光线处理是高品质插画作品的关键之一。通过巧妙地运用光线,艺术家们能够为作品增添深度和立体感,使人物或物体更加生动逼真。
-
8k wallpaper 8k 是一种超高分辨率的显示技术,其分辨率远高于传统的全高清(1080p)屏幕。这意味着作品可以在大型屏幕上呈现出更加细腻和清晰的视觉效果。
接下来,我们再来看看现实系关键词:
-
photograph 这个词通常用来形容非常接近现实的作品。它要求作品中的元素和场景必须具有高度的真实性和细节。
-
photorealistic 这是一个更加强调作品真实性的术语。它意味着作品几乎就像一张真实的照片一样,具有极高的视觉相似度。
然后是插画风的关键词:
-
illustration 插画风通常指的是具有故事性和艺术性的绘画作品。它强调作品的表现力和创意性。
-
painting 这个词通常用于描述具有传统绘画风格的作品。它可能包括油画、水彩画或其他类型的绘画技巧。
-
paintbrush 画笔是插画创作中常用的工具之一。这个词可能暗示着作品采用了手绘的风格,或者是用数字工具模仿传统绘画的效果。二次元风格的关键词:
-
anime anime 是日本动画的英文缩写。它通常指的是具有鲜明个性、夸张特征和丰富情感的日本卡通角色。
-
comic comic 指的是漫画。它通常包括连续的故事情节和生动的插图。
-
game CG game CG 指的是游戏中的计算机生成的图像。它通常用于游戏场景、角色和特效的制作。最后,我们来看三维场景的关键词:
-
3D 3D 是一种常见的插画表现形式。它通过创建立体的空间感和透视感来增强作品的真实感和动态感。
-
C4D render C4D 是 Cinema 4D 的缩写,这是一种流行的 3D 建模和渲染软件。render 指的是渲染过程,即通过软件将 3D 模型转换为二维图像的过程。
-
unreal engine,octane render unreal engine 和 octane render 都是先进的图形渲染引擎。它们可以帮助艺术家更轻松地创建出高质量的三维场景和角色。
至于画风词
`Cyberpunk 赛博朋克``8bit/16bit pixel 像素风``studio ghibli 宫崎骏风格``pixel style 皮克斯风格``Chinese ink style 水墨画`
在这里插入图片描述
2.画面主体描述:
-
人物:一位年轻的女性
-
年龄:大约25岁
-
发型:长发,自然卷曲
-
头发颜色:深棕色
-
情绪表情:自信而略带神秘微笑,清晰详细的面孔
-
衣服装束:时尚的黑色皮夹克,搭配牛仔裤和白色运动鞋
-
正在于什么:她正站在一个充满未来科技感的城市街头,似乎在等待着某人或某事的发生。
3.环境,场景,灯光,构图:
-
环境:一个充满未来科技感的城市,高楼大厦和LED屏幕构成了城市的背景。
-
场景:夜晚的街头,路灯和霓虹灯光营造出一种神秘而温馨的氛围。
-
灯光:主要来自路灯和霓虹灯,为场景增添了一种独特的色彩。
-
构图:以人物为中心,城市建筑和灯光为背景,形成了一种深度和立体感。
4. lora模型:
- 提示词:
<lora:cyberpunk_20230617024306:1>,
5. 负面词
`NSFW, [worst quality:2], [low quality:2], [normal quality:2], lowres, normal quality, [[monochrome]],[(grayscale)], skin spots, acnes, skin blemishes, age spot, [ugly:1.331], [duplicate:1.331], [morbid:1.21], [extra legs:1.331], [fused fingers:1.5], [too many fingers:1.5], [unclear eyes:1.331], lowers, bad hands, missing fingers, extra digit,bad hands, missing fingers, [[extra arms and legs]]`
NSFW,【最差质量:2】,【低质量:2】,【正常质量:2】,低分辨率,正常质量,【【单色调】】,【(灰度)】,皮肤斑点,痤疮,皮肤瑕疵,老年斑,【丑陋:1.331】,【重复:1.331】,病态:1.21】 ,【多腿:1.331】 ,【手指融合:1.5】 ,【手指太多:1.5】 ,【【模糊的眼睛:1.331】】,降低,坏手,缺失的手指,多余的手指,坏手,缺失的手指
prompt - all -in - one
在好易智算平台中,已经集成了完整的提示词插件!,如图其插件内提供了大量的提示词和基础的常用模型供我们使用
我们可以直接输入中文,会自动进行翻译
提示词
Stable Diffusion 最强提示词手册
- Stable Diffusion介绍
- OpenArt介绍
- 提示词(Prompt) 工程介绍
- …
第一章、提示词格式
- 提问引导
- 示例
- 单词的顺序
- …
有需要的朋友,可以点击下方卡片免费领取!
第二章、修饰词(Modifiers)
- Photography/摄影
- Art Mediums/艺术媒介
- Artists/艺术家
- Illustration/插图
- Emotions/情感
- Aesthetics/美学
- …
第三章、 Magic words(咒语)
- Highly detailed/高细节
- Professional/专业
- Vivid Colors/鲜艳的颜色
- Bokeh/背景虚化
- Sketch vs Painting/素描 vs 绘画
- …
第四章、Stable Diffusion参数
- Resolution/分辨率
- CFC/提词相关性
- Step count/步数
- Seed/种子
- Sampler/采样
- 反向提示词(Prompt)
第5章 img2img(图生图),in/outpainting(扩展/重绘)
- 将草图转化为专业艺术作品
- 风格转换
- lmg2lmg 变体
- Img2lmg+多个AI问题
- lmg2lmg 低强度变体
- 重绘
- 扩展/裁剪
- …
第6章 重要提示
- 词语的顺序和词语本身一样重要
- 不要忘记常规工具
- 反向提示词(Prompt)
- …
第7章 OpenArt展示
- 提示词 (Prompt)
- 案例展示
- …
篇幅有限,这里就不一一展示了,有需要的朋友可以点击下方的卡片进行领取!