Al绘画小白福音!StableDiffusion保姆级教程

上一篇文章,我们介绍了AI绘画模型的类型,并且安装好了模型,今天,我们就来进行 AI 绘画的文生图实战。

文生图实战

模型安装后之后,就可以开始激动人心的 AI 文生图了,下面我们以文生图为例,一边操作一边讲解提示词的语法和分类,以及出图参数的作用和使用方法。

在开始之前,我们再来回顾一下,我们的需求是让 AI 生成我们所要求的图片。

图片风格由模型本身和提示词决定,不同模型擅长生成不同风格的图片;而图片内容由我们的提示词决定,正向提示词会让图片展示对应内容,也会影响画质,反向提示词会让图片不生成什么内容;同时,提示词也可以分为内容提示词以及画质和画风提示词可以帮助我们将我们需要的图片更加具体准确的描述出来;而出图参数决定生成图片的大小,数量,质量等。

OK,下面是一个实际案例,通过文字来生成二次元图片。

我选择了大模型 「cetusMix_Version3.5」,vae 选择的是 「kl-f8-anime2.ckpt」,这是一个比较通用的二次元 vae 模型。

接下来需要输入提示词让 AI 知道你想要画的内容是什么,所以,我们这里先介绍一下提示词的概念、分类和语法。

提示词概念

什么是提示词 (prompt) ?广义地解释,Prompt 是指用户输入的文本或图像信息,目的是指导模型根据一些特定的需求生成艺术作品,翻译过来就是你告诉 AI,你想要画的内容是什么,画成什么样的一种语言。之前我们提到过,AI 绘画的两种基本形式是文生图和图生图,文生图主要通过文字来传递信息,而图生图则是通过图片和文字一起来传递信息。

提示词包括的内容,是非常广泛的,它可能包括作品主题、画风、形象特点以及一些具体包含的要素,不同的提示词分别向AI描绘了画面风格、人物体貌、服饰特点、场景内容和一些额外的修饰性元素。下面我们介绍一下提示词的分类。

提示词分类

提示词按正向反向可以分为正向提示词和反向提示词,正向提示词的内容是你需要图片生成出来的,而反向提示词的内容是你不想让图片出现的,反向提示词一般用通用提示词就可以了,是为了避免AI 绘制出,低质量,丑的,多手指,少手指等情况出现。。

提示词按内容和画质可以分为两个大类,内容提示词和画质画风提示词,两个大类下面又各有几个小类;。

内容提示词

人物及主体特征

  • 服饰穿搭
  • 发型发色
  • 五官特点
  • 面部表情
  • 肢体动作

场景内容

  • 室内、室外
  • 大场景
  • 小细节

环境光照

  • 白天黑夜
  • 特定时段
  • 光环境
  • 天空

画幅视角

  • 距离 close-up,distant
  • 人物比例 full body,upperbody
  • 观察视角 from above, view of back
  • 镜头类型 wide angle,Sony A7

画质和画风提示词

  • 通用高画质 bestquality,ultra-detailed,masterpiece,hires,8k
  • 特定高分辨率类型 extremelydetailedCGunity8kwallpaper(超精细的8KUnity游戏CG),unrealenginerendered(虚幻引|擎渲染)
  • 插画风 illustration,painting,paintbrush
  • 二次元 anime,comic,gameCG
  • 写实系 photorealistic,realistic,photograph

通用模板

下面给出一个通用模板。

img

提示词语法

基本语法

  • 提示词需要用英语来书写;
  • 以词组为单位,不需要完整的句子。
  • 通过英文半角逗号 「,」 来分隔提示词。

提示词权重

给提示词加权重,一层原括号是1.1倍,两乘括号就是1.1乘以1.1等于1.21倍;比如 (red ball), ((blue ball)) 。同样的,大括号是1.05倍,方括号是0.9倍。

你也可以在直接在括号中对给提词词加一个冒号,输入数字的权重;比如 (yellow flower:1.5) 。

注意一个词条的权重不能太高,安全范围是0.5到1.5;太高的话,容易毁坏整个画面。

img

进阶语法

img

进阶语法对于新手来说基本用不到,之后有机会单独讲解。

ok,那讲解完这些概念之后,我们开始真正的输入提示词,先输入正向提示词,其实也很简单,你可以按照我给出的提示词模板,从下往下一个一个去输入即可,这里我输入的是:

1girl, solo focus, tall female, grey hair, very long hair, purple eyes, large breasts, wide hips, sharp face, jewel-like eyes, serious, tired, wearing long grey coat, black blazer, black legwear, stylish sneakers, accessories, smartwatch, flower hair ornament, cute smile, sitting, cafe, coffee shop ambience, coffee shop aesthetic, snow on window, dawn, window view, massive cityscape, beautiful view, dim-lit ambience, holding coffee, {correct posing}, {detailed clothing}, {detailed body}, {correct body anatomy}, {extremely beautiful and delicate anime face and eyes}, {minute details}, {intricate details}, {delicate}, (masterpiece), (best quality), (wallpaper), (8k hd),

然后输入反向提示器,这个一般是有模板的,可以参考其他大佬的,这里我输入的是

extra fingers,fewer fingers,(low quality, worst quality:1.4), (bad anatomy), (inaccurate limb:1.2),bad composition, inaccurate eyes, extra digit,fewer digits,(extra arms:1.2), easynegative

输入好提示词后,就需要输入出图参数来控制图片质量,大小,生成数量等,下面详细介绍一下出图参数。

出图参数

采样迭代步数

采样迭代步数就是 AI 从噪点图到生成最终图片中间的一个步数,所以步数越多,生成出来的图片越清晰;不过增加步数意味着计算时间也会增加,当采样步数大于20之后,画面的提升并不明显,因此默认采样步数都是20。

采样方法

可以理解为AI 生成图像过程中采用的方法,web UI 提供了很多种方法,不过最常用的也就其中四五种。

Euler的适合生成插画风格,生成的图片比较朴素;DPM2M和2MKarras速度较快;SDE Karras 细节会较为丰富。这些方法的特征都是相对而言的,并不一定准确,还和提示词和模型有关。

采样方法更加推荐带加号的,这些方法都是经过改进的,更加优秀。同时,有些大模型会推荐算法,照做即可。

图片大小设置

图片大小默认为 512*512像素,而将宽度和高度修改到1024像素后,即使是在相同模型和提示词下,像素的图片质感也会更好;但是也不能将图片像素设置的过大,一是你的显显卡显存可能不够,二是图片太大容易出现多手多脚等异常情况,这是因为训练模型的时候更多的是使用分辨率较小的图片。

所以一般方法为使用默认图片大小 512*512像素,同时勾选高清修复,本质为将生成的图片再经过一次图生图,将图片放大,后续会专门针对图片高清化进行讲解。

提示词引导系数

提示词引导系数和之前的提示词权重是一个道理,提示词引导系数的安全范围是7到14。

生成次数和生成数量

生成次数是针对相同的模型和提示词,生成多少次。而生成数量是一次生成几张图片。这里更推荐的是提高生成次数而非生成数量,因为提高生成数量的方法是将多张图片拼在一起,看成一张更大的图片去画的,对设备的要求比较高;而提高生成次数只是将生成图片的步骤重复多次而已,对设备的要求没有这么高。

OK,详细介绍完出图参数之后,我们开始实际的去输入出图参数,这里我输入的是:

Sampler:DPM++ 2M Karras CFG scale:7 Steps:20 Clip skip:2

给一张全图如下:

img

右边这张图片就是生成结果,可以看出还是很不错的。我们也可以多生成几次,看看效果。

img

OK,这次的实战就到这里结束了,更多的是起一个抛砖引玉的效果,只有你真正去自己做图,才能知道如何去写提示器和出图参数。

以上就是这篇文章的全部内容啦!如果喜欢的话不要忘记点个关注,你也可以点点赞,在评论区与我交流,这对我真的很重要!

关于AI绘画技术储备

学好 AI绘画 不论是就业还是做副业赚钱都不错,但要学会 AI绘画 还是要有一个学习规划。最后大家分享一份全套的 AI绘画 学习资料,给那些想学习 AI绘画 的小伙伴们一点帮助!

对于0基础小白入门:

如果你是零基础小白,想快速入门AI绘画是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以找到适合自己的学习方案

包括:stable diffusion安装包、stable diffusion0基础入门全套PDF,视频学习教程。带你从零基础系统性的学好AI绘画!

需要的可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

1.stable diffusion安装包 (全套教程文末领取哈)

随着技术的迭代,目前 Stable Diffusion 已经能够生成非常艺术化的图片了,完全有赶超人类的架势,已经有不少工作被这类服务替代,比如制作一个 logo 图片,画一张虚拟老婆照片,画质堪比相机。

最新 Stable Diffusion 除了有win多个版本,就算说底端的显卡也能玩了哦!此外还带来了Mac版本,仅支持macOS 12.3或更高版本

在这里插入图片描述

2.stable diffusion视频合集

我们在学习的时候,往往书籍源码难以理解,阅读困难,这时候视频教程教程是就很适合了,生动形象加上案例实战,一步步带你入坑stable diffusion,科学有趣才能更方便的学习下去。

在这里插入图片描述

3.stable diffusion模型下载

stable diffusion往往一开始使用时图片等无法达到理想的生成效果,这时则需要通过使用大量训练数据,调整模型的超参数(如学习率、训练轮数、模型大小等),可以使得模型更好地适应数据集,并生成更加真实、准确、高质量的图像。

在这里插入图片描述

4.stable diffusion提示词

提示词是构建由文本到图像模型解释和理解的单词的过程。可以把它理解为你告诉 AI 模型要画什么而需要说的语言,整个SD学习过程中都离不开这本提示词手册。

在这里插入图片描述

5.AIGC视频教程合集

观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

在这里插入图片描述

实战案例

纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述
这份完整版的学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值