AI绘画教程 Stable Diffusion中如何控制人像的姿势?

在AI绘画中,有时候我们需要主角(人物或动物)摆出特定的姿势,该怎么做呢?

第一种方法:以图生图

打开Stable Diffusion界面,点击imag2img

图片

下面出现一个”drop image here or click to upload”的方框,从网上找一张你希望呈现的姿势图片,比如一个老鹰,姿势:双眼盯着远方。把这张图片拖拽到方框,或者从本地电脑上传。

图片

然后在提示词框里输入提示词,比如:a dragon ,然后点击generate生成图像。但是这样生成的图像,姿势不好控制,有些会比较像,有些差很远。

第二种方法:使用ControlNet。这是一个很强大的stable Diffusion插件,可以精准的控制AI绘画中人物或动物的姿势,从而生成很多好玩有创意的图片。

比如,穿上钢铁侠战衣的擎天柱:

图片

现在大部分stable Diffusion的colab包都自带ControlNet,如果你使用的版本里没有,可以打开extensions,在安装时勾选ControlNet

图片

下载ControlNet模型那一栏,选择通用的姿势控制模型ControlNet_openpose(也可以都选)

图片

现在,打开stable Diffusion,可以在提示词框下面看到control net的按钮

图片

图片

有一个Enable的方框,勾选,就启用control net了。

我们来测试下control net的效果。先不启用control net,输入提示词,生成如下图片,可以看到图片中人物的姿势各异。

图片

然后我们上传一张瑜伽动作姿势的图片到control net,然后勾选enable,Preprocessor选择openpose,Model选择openpose-sd21-safe [2be3125b]

图片

再次点击generate按钮,这时候生成的图片基本保持了和上传图像中的瑜伽动作

图片

但是,这个动作和源照片中的瑜伽动作差距有些大,生成效果不是很理想。这不是插件的问题,而是选用的模型不太对。

Control net的Preprocessor有很多种模型可选:canny、depth、depth_leres、hed、mlsd、

normal_map、openpose、openposehand、clip_vision、color、pidinet、scribble、fake_scribble、segmentation、binary。这些都是什么意思呢?

Openpose:最常用的模型,采取图片中的人物骨架做为参考,以生成图片。用于人物动作。

图片

图片

Canny:撷取图片中的边缘线做为参考,以生成图片

图片

图片

mlsd :撷取图片中明显的直线做为参考,以生成图片。一般用于建筑、物体的检测,常用于室内装潢,建筑设计

图片

图片

Hed:撷取图片中的特征做为参考,以生成图片。也是边缘提取,跟canny类似

图片

Scribbles:手稿模型 撷取使用者提供的线条做为参考,以生成图片。可以把随手画的涂鸦生成精美的画面

图片

Segmentation:将图片化为大略的色块作为参考,以生成图片

图片图片

Depth:提取深度检测信息,可以生成具有同样深度结构的图 。

图片

图片

normal:模型识别,跟深度图有点类似,但对于细节的保留更加的精确。通过读取原图片中的深度信息和法线背景阈值。

图片

图片

Pidinet:检测图像中的曲线和直线条,然后生成图片。生成的结果和HED有些相似。不过,细节会少一些。图片

Fake Scribble:从成品图中提取出草图 ,和涂鸦是倒过来的。

总结下,这些不同的模型采用的不同方法来控制姿势,并没有谁更好谁更差,而是需要根据需要和图像特征来选择对应的合适模型。

图片

通常来说,对于人像,HED 模型可以最精准的复制人物动作。Canny 、 depth、normal也不错,但是有时可能会有一些变形。从上面图像来看,不仅复制了动作,还复制了、发型和衣服,效果不是很理想。OpenPose在复制动作的同时,则没有死板的去复制衣服和发型,而是精准的生成提示词中的内容,可以说是形神兼备,效果最佳。mLSD则完全不适合人像,复制效果非常差。

回到最开始的例子中,将preprocessor模型从openpose改成hed,可以看到生成图片中人物的动作和源图片中的人物动作一模一样,精准还原。

图片

关于AI绘画技术储备

学好 AI绘画 不论是就业还是做副业赚钱都不错,但要学会 AI绘画 还是要有一个学习规划。最后大家分享一份全套的 AI绘画 学习资料,给那些想学习 AI绘画 的小伙伴们一点帮助!

对于0基础小白入门:

如果你是零基础小白,想快速入门AI绘画是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以找到适合自己的学习方案

包括:stable diffusion安装包、stable diffusion0基础入门全套PDF,视频学习教程。带你从零基础系统性的学好AI绘画!

需要的可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

1.stable diffusion安装包 (全套教程文末领取哈)

随着技术的迭代,目前 Stable Diffusion 已经能够生成非常艺术化的图片了,完全有赶超人类的架势,已经有不少工作被这类服务替代,比如制作一个 logo 图片,画一张虚拟老婆照片,画质堪比相机。

最新 Stable Diffusion 除了有win多个版本,就算说底端的显卡也能玩了哦!此外还带来了Mac版本,仅支持macOS 12.3或更高版本

在这里插入图片描述

2.stable diffusion视频合集

我们在学习的时候,往往书籍源码难以理解,阅读困难,这时候视频教程教程是就很适合了,生动形象加上案例实战,一步步带你入坑stable diffusion,科学有趣才能更方便的学习下去。

在这里插入图片描述

3.stable diffusion模型下载

stable diffusion往往一开始使用时图片等无法达到理想的生成效果,这时则需要通过使用大量训练数据,调整模型的超参数(如学习率、训练轮数、模型大小等),可以使得模型更好地适应数据集,并生成更加真实、准确、高质量的图像。

在这里插入图片描述

4.stable diffusion提示词

提示词是构建由文本到图像模型解释和理解的单词的过程。可以把它理解为你告诉 AI 模型要画什么而需要说的语言,整个SD学习过程中都离不开这本提示词手册。

在这里插入图片描述

5.AIGC视频教程合集

观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

在这里插入图片描述

实战案例

纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述
这份完整版的学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值