一分钟教你成为大魔法师(AI-Stable Diffusion Prompt咒语篇)

大家好我是阿道夫!!
Stable Diffusion,一款基于深度学习的图像生成模型,以其强大的图像生成能力和个性化风格迁移能力,在艺术创作领域掀起了一场革命。而Prompt,作为Stable Diffusion的咒语,能够引导和控制生成图像的方向和风格。本文将带你一分钟掌握Stable Diffusion Prompt的使用技巧,让你轻松成为大魔法师。
在这里插入图片描述

今天我们来聊一聊AI绘画跟咒语有什么关系呢?记得吗,生图的过程中,我们需要向AI输入提示词(Prompt),由于提示词必须是英文书写,很长很乱,而且穿插着各种奇怪的数字、符号,就像是一串一串的咒语一样。因此大家把写提示词这个过程戏称为“念咒”而我们就像魔法师一样,通过“吟唱咒语”来变出我们想要的结果。

虽然说AI是人工智能,但是它人类智慧还是有一定差距的,很多时候它并不知道你想要的是什么。所以这也是为什么“念咒”这件事情在AI盛行的今天慢慢形成了一门独立的可以去探讨、研究的学问。接下来我们进入“咒语”的学习吧。(演示部分为Stable Diffuion)

提示词入门

提示词的概念

当我们产生作画意图需要生成图像时,通过传递需求、描述画面对AI绘画进行指令,这个过程中提示词就起到了一个桥梁的作用。直白点说,它是我们用来告诉AI,我要画什么,画成什么样的一种语言。之前我们提到过文生图和图生图两个概念,文生图主要就是以提示词来沟通需求的,而图生图还能通过图片来传达信息。但图生图里也需要提示词,并且同样重要。

提示词包括的内容是非常广泛的,它可能包括作品主题、画风、形象特点以及一些具体包含的要素。以我绘制过的一张图片为例,它的提示词足足有十几行那么长。不同提示词分别向AI描绘了画面风格、人物体貌、服饰特点、场景内容和一些额外的修饰性元素。别看这么多词,其实很多风格和画质把控的提示词是固定的。

虽然说提示词不是越多越好,但很多时候提示词多点比少写点的效果肯定要好,并且在特定的需求上控制会更加精确。所以想让AI按照我们的需要去产图,提示词到底该怎么写呢?

其实在写提示词的时候是有技巧的,在写提示词的时候把输入法调成英文,英文里面涉及到的符号基本上都是英文。提示词可以换行,但是每一行的末尾要打上分隔符。

内容型提示词

输入好提示词后点击生成,你会发现每次生成的图都不一样,可能效果很好也可能生出古神图。因此有人把AI绘画比喻成“抽卡”。但其实很多时候是因为你的提示词太笼统了,不够具体,因此只需要把提示词慢慢的填充调整。提示词有很多分类,简单概括就是这些:

  • 人物及主体特征:服饰穿搭、发型发色、五官特点、面部表情、肢体动作

  • 场景特征:室内/室外、大场景、小细节

  • 环境光照:白天黑夜、特定时段、光环境、天空

  • 画幅视角:距离、人物比例、观察视角、镜头类型

你也可以加入一些形容词,beautiful、happy等,这些形容词虽然有点抽象,但是在一定程度上对画面是有影响的,如果你想要的是室外的场景最好加上outdoor反之加上indoor,它会很显著地影响整个画面的氛围。

标准化提示词

只有内容型的提示词往往画出来的东西有很大概率不会让你满意的、像这种作品,你会觉得很模糊,细节不够清晰,这里我们就需要添加标准化提示词来给画面提提神。首先是画质,这可以让你的画面往画质高的方向靠。

  • 通用的高画质有:best quality,ultra-detailed,masterpiece,hires,8k

  • 特定高分辨率类型:extremely,detailed CG unity 8k wallpaper(超精细的8kUnity游戏CG),unreal engine rendered(虚幻引擎渲染)

还有一些就是画风提示词。

  • 插画:illuseration,painting,paintbrush

  • 二次元:anime,comic,game CG

  • 写实系:photorealistic,realisttic,photograph

注:写实系的创作更加依赖于真实照片训练的模型

这里提供一下通用模板的提示词,你可以按照这个方式修改里面的每一个细节,让你的画面变得更加符合需要。内容型的提示词是根据你想要创作的而定的,所以每次都需要修改。提示词词组化就可以解决这个问题,当你想要微调的时候只需要修改某个词组就好了。而标准化的提示词是相对固定可以抄作业的,主要你想画的是某种风格的图,就可以把上面的提示词重复利用。

权重与负面提示词

在提示词里往往需要通过符号和数字来影响提示词的权重。比如你输入了提示词胸针,但是它画面没有出现胸针这个物件。这里的原因在于,你输入了很多不同的元素给AI,都要它画,但他在处理的过程中,不一定能get到你最想要的是什么所以可能优先去画了树或衣服。如果你特别想要胸针,就可以通过这种方式来强调胸针:

  • 套括号()在提示词两侧加上这种圆括号(),注意是英文半角的括号。它的权重就会变成原来的1.1倍,相对于前天元素就会更突出。你还可以套多层括号,(((提示词)))每套一层就再乘1.1倍。三层就是1.331倍,这个时候你想要的内容可以凸显出来了。

  • 括号加数字权重,加了括号以后加上英文引号(white flower:1.5),比如1.5,就是原来的1.5倍权重

当你觉得画面里你输入了提示词但AI没有把你画出来的时候,就可以借助这些方法来强调。加数字的方式明显准确,加括号就更方便微调,不同的括号强调的倍数也是不同的。而你想要削弱某个提示词的时候,就可以加上一个小于1的权重数值或者用方括号 [提示词],会把权重削成原来的0.9倍。

调整权重的时候注意,不要把个别词条的权重调的太高,尽量保持在1±0.5左右。当你设置了个别2左右甚至更高的数值时,画面就很容易扭曲。

这里还有一个进阶的语法,简单提一下,之后再单独拿一个篇幅来讲。

提示词另外一个重要部分,就是反向提示词。通俗点说,你希望这个画里出现什么,就往正向提示词里丢,不希望它出现什么,就往反向提示词里丢。反向提示词是可以没有的,但一般我们也会加入一些通用的项目,主要也是基于图片的标准化。

出图参数设置

如果说提示词是咒语,那么下面的出图参数就像是魔法师的魔杖和魔导师一样,控制了咒语的具体释放形式。

看到这一大堆参数,是不是感觉眼睛都要花了,别担心,我们来梳理一下:

采样迭代步数

我们之前说过了,AI生成图像的过程是加噪再去噪。去噪的过程就是用像素点去模拟你最终想要生成的图像,每模拟一次,画面都会变得更清晰。也就是在AI生成图片时一闪一闪的过程。理论上来说,迭代步数也高,画面最终效果肯定清晰。实际上,当步数大于20以后,就变化不大了。所以一般都是默认20步采样步数

采样方法

其实可以简单解释成AI进行图像生成的时候使用的某种特定算法,WeBUI的算法选项非常多,足足有十几个,但是我们常用到的估计也就4~5个。这其中,Euler的两个适合插画风格,出图比较朴素。DPM 2M和2M Karras速度比较快,DPM Karras细节会较为丰富。这些评价并不一定准确,也会跟提示词和模型的不同产生差别。实际使用时推荐最下面带有+号的,它们是改进过的算法,无论如何都比上面的稳定。

大部分模型都会推荐使用具体的某个采样方法,比如下方

宽和高

代表的是最终你出图的分辨率,分辨率的设置存在一些隐性限制,默认的分辨率是512x512。但是这个分辨率的图哪怕细节再丰富,看起来可能都是很模糊的。设备允许的情况下,一般把分辨率提到1000左右。相同的提示词,分辨率不一样,跑出来的图质感差别是不是就完全不一样了。

但是分辨率吃显卡显存的,如果调得过高,就会出现爆显存的情况。还可能出现一张图片里多手多脚,多人的情况。这个是因为训练的模型一般都是512x512的图,你的分辨率过高,AI就会想办法多放一点内容来填满画面。为了避免这种情况,我们一般生成的时候先用低分辨率的生成,再使用高清修复(Hires Fix)来放大。这个在前几期里面有讲过,想要了解深入的可以往前翻翻。

面部修复

旁边的面部修复一般都会够选上,它会采用一些对抗算法识别人物面部并进行修复,和我们用的美图app里的智能瘦脸差不多。

平铺/分块(Tiling)

平铺是用来分成那种无缝贴满整个屏幕的纹理性图片的,如果你没有需要,千万别勾,会让你的画面变得很奇怪。

提示词相关性(CFG Scale)

提示词相关性越高,AI对提示词反馈的程度就越高。但和权重一样,我们一般不会浮动太多,7~12之间是比较安全的数值。太高容易变形。

随机种子

这个是用来控制画面内容一致性的重要参数,下期再细讲这个。

生成批次和数量

因为AI绘画的不确定性,即使是同一组提示词,你也需要反复试验。如果你想让AI按照同一组提示词和参数不断出图,那就把批次调高,绘制的过程会不断重复。它会生成你设定的批次数的图和对比图,可以批量生成再挑其中满意的细化。但是每批数量不建议挑高,配置不好容易爆显存。

新手必备提示词方法

讨论了那么多的提示词,我们再来聊聊新手写提示词方面取巧的方法,新手写提示词一共分为三种方法:

翻译大法

无论提示词再怎么复杂,其实表达的都是人话,只需要把你想画的东西一件一件说出来就好了。还是那句话,SD不认中文,你得用翻译软件把它转为英文,比如这样。

借助工具

AI绘画的提示词难写大家都知道,所以国内大佬已经把辅助书写提示词的网站(ai.dawnmark.cn/)做出来了。它的用法很简单,你可以像选参数一样,勾选你需要的,它会自动帮你整理,然后你复制粘贴到自己的SD就可以了。

抄作业

在AI绘画里抄作业是很正常的事,在一些模型网站和绘画分享网站上,很多创作者会把自己使用过的咒语和模型分享出来,帮助大家获得类似的效果。这里推荐两个用来搜索提示词的网站,一个是Openart.AI,里面有很多基于SD官方模型和欧美主流模型生成的作品。另一个网站记录的二次元作品和亚洲审美的内容更多一点。不过大家抄作业的时候记得筛选一下,如果你想要画面里内容型的部分就复制内容型的提示词,如果只是喜欢画风或者画质什么的就抄标准化的部分。

这三种方法梳理下来,写提示词是不是就简单多了。

资料软件免费放送

次日同一发放请耐心等待

关于AI绘画技术储备

学好 AI绘画 不论是就业还是做副业赚钱都不错,但要学会 AI绘画 还是要有一个学习规划。最后大家分享一份全套的 AI绘画 学习资料,给那些想学习 AI绘画 的小伙伴们一点帮助!

感兴趣的小伙伴,赠送全套AIGC学习资料和安装工具,包含AI绘画、AI人工智能等前沿科技教程,模型插件,具体看下方。

需要的可以扫描下方CSDN官方认证二维码免费领取【保证100%免费】

在这里插入图片描述

**一、AIGC所有方向的学习路线**

AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。

在这里插入图片描述

在这里插入图片描述

二、AIGC必备工具

工具都帮大家整理好了,安装就可直接上手!
在这里插入图片描述

三、最新AIGC学习笔记

当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
在这里插入图片描述
在这里插入图片描述

四、AIGC视频教程合集

观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

在这里插入图片描述

五、实战案例

纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述
这份完整版的学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

在这里插入图片描述

  • 7
    点赞
  • 31
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值