对于最近AI绘画思考的总结...

最新推荐文章于 2024-08-21 20:11:07 发布

AIGC大师兄

最新推荐文章于 2024-08-21 20:11:07 发布

阅读量300

点赞数 3

文章标签： AI作画人工智能 ai绘画 stable diffusion midjourney ai AIGC

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2401_84294719/article/details/139193348

版权

这段时间看了很多AI绘画作品，也看了很多关于AI的讨论，尝试着推测一下目前AI的运算思路。

就我观察来看，目前AI对绘画的学习是基于二维平面的大数据相似性，而不是基于对物体的主观意识识别。

举个例子，最近AI画脸越来越好了，那是因为AI理解了面部结构吗？并不是，它只是拿了无数的脸部照片进行学习，结合各个角度脸部照片中五官所呈现出的像素形状与位置，理解了哪些像素形状下的五官属于同一组（同一角度），应该怎样互相结合并贴在大概对应的位置上才算正确。

或者干脆找已录入的五官照片当相似性参考，替换照片中的五官，在大数据中寻找像素形状类似的五官拼上去，于是就看着很像那么回事了。

包括画风，只要把对应画家的色块结合方式用数据的形式记录下来，并在保留大共性的前提下重新排列组合，便能模仿画风了，这比模仿人脸还要简单，所以最开始便能做到。

其实，很早之前职业画师就已经有过类似的共识了——画风就像程序数据，只要理解了其共性，任何人的画风都能模仿。而机器只是比人在数据化方面更有优势罢了。

但这样建立在像素模拟的前提下进行的绘画，很容易便会遇到瓶颈，要知道，无表情的人脸只是人体中变化性最小的部分，只有角度变化没有动态变化，而这种学习方式一旦遇到动态角度都有变化，且变化总数量趋于无穷的全身人体，就可能需要非常非常多的时间来录入参考，或者就只能找已录入的动态替换像素，然后动态的变化完全被网络参考图数量限制。

而在人体之外，还有猫狗等各种动物，还有各种物件，无法拥有主观意识识别，只能学习像素形状相似性的AI，局限性其实非常之大。

逛过油管的人应该都遇到过这种情况，看着看着视频突然弹出一个人机身份验证，然后要你从九宫格的照片中选出有红绿灯或自行车什么的图，全选对了才能接着看视频。

那你有没有想过，为什么油管要用识别物体的题目当做人机身份验证呢？是不是因为这些识别是只有人类才能做到的呢？

当然，AI也能做到一定程度的识别，比如，如果全世界的红绿灯都是红黄绿三色齐亮且冲着镜头，那AI肯定能识别出红绿灯，因为这是可以基于像素相似性归纳出的。

但真实的情况是，红绿灯只同时亮一个灯，有些时候还不对着镜头，有些干脆坏了不亮，而红绿灯的外形轮廓本来又不统一，再加上拍照角度的区别，像素轮廓相似性极低，AI根本无法做到正确率较高的识别，所以突破不了人机身份验证。

所以换言之，AI只能识别一些像素层面很具备标志性的物体，比如人脸狗脸猫脸等等，但如果把对象换成不太有标志性的像素，比如俯视的、四爪缩回身体的柴犬，AI可能就会把它和牛角面包归为一类。

而人之所以能识别，是因为人具备联想能力，人看到一坨黄白之物趴在地毯上，体型还很大，自然就知道那是只狗，但AI即不知道何为地毯，也不懂参照周围物体确定体积，更不懂联想，便无法分辨像素轮廓不明确的狗和牛角面包。

所以人看到马路上立着根杆子，自然就会联想到红绿灯，而AI却做不到。

当然，人的联想能力也经常搞乌龙，比如人会下意识凭经验觉得球场看台上的各色杂乱像素点是观众，所以只要把看台椅子涂成各种颜色，电视机前的人就会以为球场观众席满坑满谷，不过这就是另一个话题了。

所以综上所述，就我观察，现在的AI至多只能做到像素层面的识别和模仿，因为有意识的辩识能力是需要联想的，这属于人类智慧的一部分，除非AI拥有了智慧，否则突破不了这层桎梏。

而只能做到像素识别能力的AI，根本无法满足较为复杂的需求和创作，自然也就代替不了人，代替不了需要较高识别能力的中高层绘画工作。

关注

3
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
对于最近AI绘画思考的总结...

但这样建立在像素模拟的前提下进行的绘画，很容易便会遇到瓶颈，要知道，无表情的人脸只是人体中变化性最小的部分，只有角度变化没有动态变化，而这种学习方式一旦遇到动态角度都有变化，且变化总数量趋于无穷的全身人体，就可能需要非常非常多的时间来录入参考，或者就只能找已录入的动态替换像素，然后动态的变化完全被网络参考图数量限制。所以综上所述，就我观察，现在的AI至多只能做到像素层面的识别和模仿，因为有意识的辩识能力是需要联想的，这属于人类智慧的一部分，除非AI拥有了智慧，否则突破不了这层桎梏。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。