5分钟学会Stable Diffusion图生图功能

226 篇文章 4 订阅

(全套教程文末领取哈)
目录如下

img

注意,本文默认你已经了解所有文生图的内容,因为图生图实际上是在文生图的基础上在加上原图作为一个输入变量,和文生图中的一些参数如正负tag、模型、lora等一起作为输入变量生成最后的结果,如果对文生图不了,可以参考之前的介绍文生图的章节。

其中和文生图一样的参数此处不再赘述,包括

  • 采样方法
  • 迭代步数
  • 面部修复
  • 可平埔
  • 宽度
  • 高度
  • 生成批次
  • 每批数量
  • 提示词相关性
  • 随机种子
  • 差异随机种子、差异强度等
  • 部分脚本X、Y、Z图表等

重绘幅度(Denosing strength)

图生图中最重要的参数即为重绘幅度,首先准备一个小姐姐,不输入任何正负tag,研究下重绘幅度的对图片的影响,参数如下图所示

img

结果如下所示,可以看到妹子开始卸妆,最后到0.6直接换了一个人,1.0直接和原图无关了。

img

我们不输入负向tag,在正向tag中输入Pikachu,可以看到前几张还算正常,0.8之后就直接变成皮卡丘了

img

重绘幅度很重要,值越大表示对原图重绘幅度越大,一些放大类的插件或脚本,重绘幅度不能设置太大,否则会生成非常奇怪的结果,比如一个人变成整张图都是人,这是放大器的工作原理有关系,后需来一篇专门讲如何放大发图片到2K、4K、8K

一般设置为0.75,这样图片会有较大的变化。

缩放模式(Resize mode)

缩放模式默认拉伸,缩放模式指的是当原图和要生成的图的宽和高不一致的时候,是需要按照什么方式缩放,一共包含四种模式

  • 拉伸
  • 裁剪
  • 填充
  • 拉伸(放大潜变量)

选中右上角的小笔可以自行调整输入的图片范围

img

因为我们原图是512x1024分辨率,我们设置目标分辨率为512x512尝试,去除所有正负tag,以全图作为输入,将重绘幅度设置为0,结果如下所示,下图从左往右依次是拉伸、裁剪、填充、拉伸(放大前潜变量)

img

可以看到缩放模式和重绘幅度对最终画面产生的影响,缩放模式在图片比例不一致时告诉AI该以什么比例去缩放,下面在看一个更加直接的例子加深理解,我们对下面这张方形图变成宽图512x512的分辨率变为860x460,注意此时要保留原图所有的正负tag,因为我们要加大重绘幅度这时候需要告诉AI重绘的部分以原图的tag进行,提示词相关性设置为5避免对原有人物产生过变化

img

首先重绘幅度设置为0看下原始的缩放模式在分辨率变化后产生的影响,下图从左往右分别是

  • 拉伸
  • 裁剪
  • 填充
  • 拉伸(放大潜变量)

img

绘图(Sketch)

绘图会把颜色信息带入,重绘幅度越低,颜色信息表现得越明显,另外绘图会将输入图片的所有部分继续重绘

比如给衣服换个颜色,注意如果正向tag中有和衣服颜色相关的可以先去掉,避免对结果产生影响

  • 提示词相关性7
  • 重绘幅度0.1,0.4,0.5,0.6,0.7,0.8,1.0

img

如下所示,可以看到重绘幅度在0.5以内符合蒙版的颜色

img

再比如,画个房子,当然在正向tag中也需要一些提示,比如

sun in sky,detail light,house,grass lawn ,forest ,river

img

重绘幅度分别设置为0.1,0.4,0.5,0.6,0.7,0.8,0.9,1.0

img

可以发现0.7的效果比较符合草图,也有较大的重绘效果,再以0.7画几张试试

img

另外我们发现0.60.7之间变化最大,因此尝试下重绘幅度在0.610.69的区别,发现在0.64到0.65之间画风突然转换

img

后续又再次尝试了很多次,最终没找到渐变的过程,都是重绘幅度在某个值突然画风转变,再次细分,尝试了很多次没有找到画风渐变的过程

img

下面展示下在这个过程中感觉还蛮不错的几张

img

局部重绘(Inpaint)

局部重绘没有颜色信息,仅仅只针对蒙版部分或者非蒙版部分继续绘制(可通过选项控制),其中会多出几个选项,如下所示

img

其中比较重要的

比如换个换装

  • 提示词相关性7
  • 重绘幅度0.1,0.4,0.5,0.6,0.7,0.8,1.0
  • 加上关键词(blue school uniform:1.4),(pink t-shirt:1.4)

img

下面看看结果

img

发现在重绘幅度在0.5的时候比较符合结果,再将重绘幅度设置为0.5多尝试几批次,看起来也只是像

img

重绘幅度设置为0.6在试试

img

重绘幅度选择0.6,重绘区域选择全图试试,似乎效果更好一些

img

重绘幅度选择0.6、重绘区域选择全图、蒙版蒙住内容选择填充

img

重绘幅度选择0.6、重绘区域选择全图、蒙版蒙住内容选择潜变量噪声

img

重绘幅度选择0.6、重绘区域选择全图、蒙版蒙住内容选择潜变量数值零

img

重绘幅度选择0.6、重绘区域选择全图、蒙版蒙住内容选择原图、蒙版模式选择重绘非蒙版内容,故名思意,就是衣服不换,其他全换。可以看到

img

局部重绘(手涂蒙版)(Inpaint sketch)

这就像是将绘图和局部重绘的结合版,即保留颜色信息也保留蒙版信息,和绘图(Sketch)的区别参考如下

What is the difference between Sketch and Inpaint Sketch
Sketch tries to colour the masked zone by rendering the whole image. So in the final, you will have a totally new image (it can be very close to what you had initially). Usually, when you use Sketch, you want to use the same prompt as you had initially. Maybe, with some changes regarding your new colouring.
Inpaint sketch rerenders only the masked zone, not touching the whole image. You can write a totally different prompt, and the inpaint will try to render your prompt in the masked area by using the colour you used.
原文:https://www.reddit.com/r/StableDiffusion/comments/10jqkd5/sketch_function_in_automatic1111/

Sketch是将颜色信息带入然后重绘整张图,通常需要将所有的正负tag信息带入,而Inpaint sketch只重绘被遮住的部分,不会重绘整张图,可以完全书写不一样的tag,然后会将颜色信息带入并且只重绘被遮住的部分

再来换个装

img

重绘幅度0.6,可以看到在一定程度上参考了我们的颜色信息,而且没有写任何提示词,使用局部重绘换装似乎更好用一些

img

下面按照重绘幅度0.1,0.4,0.5,0.6,0.7,0.8,1.0依次进行,结果如下,可以发现重绘幅度在0.4~0.6之间效果比较符合预期,重绘幅度太大AI就开始在蒙版里面放飞自我了

img

换个颜色在试试

img

其他参数和局部重绘类似,大家可以自行尝试

脚本-回送(Loopback)

将输出的图片继续当作输入生成图片,迭代次数即最终生成几张,每张的前一张作为本次的输入参数一直迭代

img

脚本-向外绘制(Outpainting mk2)

采样方法DPM++ SDE Karras、步数20、重绘幅度0.6、左边为原图,右边为左右外绘的图,虽然看起来不是很符合逻辑,但是一眼就能看出这个功能的含义了,就是向图像外进行绘制,如果边缘比较硬可以调高蒙版模糊像素试试

img

上面我们没有按照该脚本的推荐设置,下面我们按照推荐设置试试

  • 步数80
  • 采样方法Euler a
  • 重绘幅度0.8

img

脚本-效果稍差的向外绘制(Poor man`s outpainting)

参考向外绘制,这是一版过时的向外绘制,仔细看还是可以就看出边缘

img

脚本-使用SD放大(SD upscale)

关于放大在Stable Diffusion中有很多方法,后续会专门开一篇文章说明,此处简单描述,注意使用放大的时候重绘幅度要比较小,否则画面可能重绘幅度过大, 导致变化太多,重绘幅度太小可能导致没有添加足够多的细节,放大是在尺寸倍增的时候适当添加细节。

反推提示词

img

在顶部生成按钮的旁边有两个按钮,这两个按钮是用来反推提示词的,比如在随便一张照片,并不是AI生成自带提示词那种(AI生成的也可以),他会根据图片的内容用文本去描述图片,第一次点击会下载相关依赖,比较慢一点

  • CLIP反推,可以看到,描述还是比较准确的,衣服、颜色、背景都符合图像,CLIP反推一般是一句话描述

img

  • DeepBooru反推,结果也很准确,不过它的风格是关键词堆砌,很想我们在书写tag时的做法

img

关于AI绘画技术储备

学好 AI绘画 不论是就业还是做副业赚钱都不错,但要学会 AI绘画 还是要有一个学习规划。最后大家分享一份全套的 AI绘画 学习资料,给那些想学习 AI绘画 的小伙伴们一点帮助!

👉[[CSDN大礼包:《StableDiffusion安装包&AI绘画入门学习资料》免费分享]]安全链接,放心点击

对于0基础小白入门:

如果你是零基础小白,想快速入门AI绘画是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以找到适合自己的学习方案

包括:stable diffusion安装包、stable diffusion0基础入门全套PDF,视频学习教程。带你从零基础系统性的学好AI绘画!

零基础AI绘画学习资源介绍

👉stable diffusion新手0基础入门PDF👈

(全套教程文末领取哈)
在这里插入图片描述

👉AI绘画必备工具👈

在这里插入图片描述

👉AI绘画基础+速成+进阶使用教程👈

观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
在这里插入图片描述
温馨提示:篇幅有限,已打包文件夹,获取方式在:文末

👉大厂AIGC实战案例👈

光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述

👉12000+AI关键词大合集👈

在这里插入图片描述
这份完整版的学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

Stable Diffusion是一种开源的像扩展工具,可以用于扩展图片功能。使用Stable Diffusion进行图生的操作如下:首先,启动Stable Diffusion,并打开图生。然后,将要扩展的图片拖入图生界面。接下来,在脚本选项中选择“向外绘制第X版”,这时会出现选项,可以选择向哪个方向扩充,并输入扩充的像素数。最后,点击确认即可生成扩展后的图片。\[2\] 此外,Stable Diffusion还提供了PNG info功能,用于查看生成图片像信息。通过PNG info可以查看生成图片的提示词、反向提示词、步骤数、采样器、种子等参数。这些参数信息通常会被写入图片的exif信息中,可以通过图片工具或Python等方式读取。如果在网上看到了感兴趣的Stable Diffusion生成图片,可以通过PNG info查看相关参数设置信息,以便进行复现或微调相应的图片。\[3\] #### 引用[.reference_title] - *1* *2* [仅做笔记用:Stable Diffusion 扩展图片 / 扩](https://blog.csdn.net/qq_35977139/article/details/131056696)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [图生AI图片生成Stable Diffusion参数及使用方式详细介绍](https://blog.csdn.net/suiyingy/article/details/130348402)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值