控制人物姿势，哪个AI绘图工具最棒？

最新推荐文章于 2024-05-20 19:08:38 发布

再不会python就不礼貌了

最新推荐文章于 2024-05-20 19:08:38 发布

阅读量564

点赞数 23

文章标签：人工智能 AIGC stablediffusion stable diffusion AI绘画

本文链接：https://blog.csdn.net/Everly_/article/details/138338860

版权

Midjourney V6 发布了，图片真实感很强。大家都欢欣鼓舞，好像世界上已经不需要摄影师了。其实，真正用过AI绘图工具的人，都知道它们的普遍弱点。这个弱点短时间内无法被彻底解决。

我们今天来一个挑战项目，用主流 AI 绘图工具 (Midjourney, DALL-E 和 Stable Diffusion) 来绘制下面这张图。这张图是从Unsplash图片库下载的，是真实的摄影图。

DALL-E

首先让 DALL-E 接受这个挑战。为了让它能够精确地呈现画面的每一个元素，包括瑜伽姿势，我写了个非常详细的提示词：

Prompt: Wide photos of an athletic Asian female performing a one-legged wheel yoga pose with one leg extended up towards the ceiling. Her back is deeply arched, forming a semi-circular wheel shape. Both her arms are straight with hands planted firmly on the ground beneath the shoulders, fingers spread wide for stability. One leg is extended straight upwards, pointing towards the ceiling, while the foot of the other leg remains on the ground, helping to maintain balance. Her hips are lifted high, contributing to the overall curvature of the body. Her head is gently dropped back, in line with the arch of the back, without straining the neck. She is wearing a fitted blue outfit in a spacious, white, minimalist corridor with a series of arches receding into the distance. Each arch boasts a clean, semi-circular design that rises from a strong rectangular base. The neoclassical style of the arches is unadorned, with no visible embellishments or intricate moldings.

提示词：一位健美的亚洲女性单腿轮式瑜伽的宽幅照片，她单腿向上伸向天花板。她的背部深深拱起，形成一个半圆形的轮子。她的双臂伸直，双手紧贴肩膀下方的地面，手指张开以保持稳定。一条腿向上伸直，指向天花板，另一条腿的脚留在地面上，帮助保持平衡。她的臀部高高抬起，形成身体的整体弧度。她的头部轻轻向后垂下，与背部的弓形保持一致，不会使颈部紧张。她身着合体的蓝色服装，在一条宽敞、白色、简约的走廊上，一连串拱门向远处退去。每个拱门都采用了简洁的半圆形设计，从一个坚固的矩形底座上升起。拱门采用新古典主义风格，没有明显的装饰或复杂的造型。

经过了几次尝试，DALL-E总算生成了姿势几乎完全标准的图像。

然而，照片整体上缺乏质感。人物的动作也显得不那么自然。

Midjourney

这个任务交给Midjourney V6怎么样呢？我们来看一下：

我用Midjourney一连生成了好几次，动作都是扭曲的。DALL-E虽然不是每次都成功，但都比较接近。然而Midjourney差的就比较远了。

即使我把Unsplash的原图给它做参考，Midjourney离标准动作依然差的很远。

不过，Midjourney对场景的理解很到位，光线的氛围也很好。

Stable Diffusion

Stable Diffusion 对自然语言的理解能力很弱，提示词的写法跟 Midjourney v5.2 有些类似。如果单纯依靠提示词用文生图生成瑜伽动作的图片的话，扭曲和变形比Midjourney还厉害。

不过还好Stable Diffusion有ControlNet插件，可以把Unsplash的图上传给Stable Diffusion做参考。通过Canny可以预先生成一个画面的大致轮廓，从而比较精准地控制画面的构图。通过Depth可以生成一幅黑白的深度图，从而可以比较精确地控制画面的纵深。

通过提示词我改变了人物瑜伽服的颜色，并把水泥地变成了木地板。我对人物的面部进行了适当的局部重绘，不过还是有些形变。

为了让人物的面部和手部更自然，我用PS把原先Upsplash里的人物面部和手部适当融合进来，最终得到了下图。

画面有些偏红，如果要更精细的话还可以继续调色。

总结

虽然Midjourney和Stable Diffusion现阶段在一定程度上能够以假乱真，如果不借助其它工具修饰瑕疵，比如Photoshop，离真正商用还存在一些距离。不过，AI的进化速度也是惊人，目前也有很多成功的商业案例，现在就可以行动起来了。

写在最后

感兴趣的小伙伴，赠送全套AIGC学习资料，包含AI绘画、AI人工智能等前沿科技教程和软件工具，具体看这里。

AIGC技术的未来发展前景广阔，随着人工智能技术的不断发展，AIGC技术也将不断提高。未来，AIGC技术将在游戏和计算领域得到更广泛的应用，使游戏和计算系统具有更高效、更智能、更灵活的特性。同时，AIGC技术也将与人工智能技术紧密结合，在更多的领域得到广泛应用，对程序员来说影响至关重要。未来，AIGC技术将继续得到提高，同时也将与人工智能技术紧密结合，在更多的领域得到广泛应用。

在这里插入图片描述

一、AIGC所有方向的学习路线

AIGC所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照下面的知识点去找对应的学习资源，保证自己学得较为全面。

在这里插入图片描述

二、AIGC必备工具

工具都帮大家整理好了，安装就可直接上手！
在这里插入图片描述

三、最新AIGC学习笔记

当我学到一定基础，有自己的理解能力的时候，会去阅读一些前辈整理的书籍或者手写的笔记资料，这些笔记详细记载了他们对一些技术点的理解，这些理解是比较独到，可以学到不一样的思路。
在这里插入图片描述

四、AIGC视频教程合集

观看全面零基础学习视频，看视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。

在这里插入图片描述

五、实战案例

纸上得来终觉浅，要学会跟着视频一起敲，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。
在这里插入图片描述

再不会python就不礼貌了

关注

23
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
控制人物姿势，哪个AI绘图工具最棒？

虽然Midjourney和Stable Diffusion现阶段在一定程度上能够以假乱真，如果不借助其它工具修饰瑕疵，比如Photoshop，离真正商用还存在一些距离。不过，AI的进化速度也是惊人，目前也有很多成功的商业案例，现在就可以行动起来了。感兴趣的小伙伴，赠送全套AIGC学习资料，包含AI绘画、AI人工智能等前沿科技教程和软件工具，具体看这里。AIGC技术的未来发展前景广阔，随着人工智能技术的不断发展，AIGC技术也将不断提高。
复制链接

扫一扫