对于最近AI绘画思考的总结...

这段时间看了很多AI绘画作品,也看了很多关于AI的讨论,尝试着推测一下目前AI的运算思路。

就我观察来看,目前AI对绘画的学习是基于二维平面的大数据相似性,而不是基于对物体的主观意识识别。

举个例子,最近AI画脸越来越好了,那是因为AI理解了面部结构吗?并不是,它只是拿了无数的脸部照片进行学习,结合各个角度脸部照片中五官所呈现出的像素形状与位置,理解了哪些像素形状下的五官属于同一组(同一角度),应该怎样互相结合并贴在大概对应的位置上才算正确。

或者干脆找已录入的五官照片当相似性参考,替换照片中的五官,在大数据中寻找像素形状类似的五官拼上去,于是就看着很像那么回事了。

包括画风,只要把对应画家的色块结合方式用数据的形式记录下来,并在保留大共性的前提下重新排列组合,便能模仿画风了,这比模仿人脸还要简单,所以最开始便能做到。

其实,很早之前职业画师就已经有过类似的共识了——画风就像程序数据,只要理解了其共性,任何人的画风都能模仿。而机器只是比人在数据化方面更有优势罢了。

但这样建立在像素模拟的前提下进行的绘画,很容易便会遇到瓶颈,要知道,无表情的人脸只是人体中变化性最小的部分,只有角度变化没有动态变化,而这种学习方式一旦遇到动态角度都有变化,且变化总数量趋于无穷的全身人体,就可能需要非常非常多的时间来录入参考,或者就只能找已录入的动态替换像素,然后动态的变化完全被网络参考图数量限制。

而在人体之外,还有猫狗等各种动物,还有各种物件,无法拥有主观意识识别,只能学习像素形状相似性的AI,局限性其实非常之大。

逛过油管的人应该都遇到过这种情况,看着看着视频突然弹出一个人机身份验证,然后要你从九宫格的照片中选出有红绿灯或自行车什么的图,全选对了才能接着看视频。

那你有没有想过,为什么油管要用识别物体的题目当做人机身份验证呢?是不是因为这些识别是只有人类才能做到的呢?

当然,AI也能做到一定程度的识别,比如,如果全世界的红绿灯都是红黄绿三色齐亮且冲着镜头,那AI肯定能识别出红绿灯,因为这是可以基于像素相似性归纳出的。

但真实的情况是,红绿灯只同时亮一个灯,有些时候还不对着镜头,有些干脆坏了不亮,而红绿灯的外形轮廓本来又不统一,再加上拍照角度的区别,像素轮廓相似性极低,AI根本无法做到正确率较高的识别,所以突破不了人机身份验证。

所以换言之,AI只能识别一些像素层面很具备标志性的物体,比如人脸狗脸猫脸等等,但如果把对象换成不太有标志性的像素,比如俯视的、四爪缩回身体的柴犬,AI可能就会把它和牛角面包归为一类。

而人之所以能识别,是因为人具备联想能力,人看到一坨黄白之物趴在地毯上,体型还很大,自然就知道那是只狗,但AI即不知道何为地毯,也不懂参照周围物体确定体积,更不懂联想,便无法分辨像素轮廓不明确的狗和牛角面包。

所以人看到马路上立着根杆子,自然就会联想到红绿灯,而AI却做不到。

当然,人的联想能力也经常搞乌龙,比如人会下意识凭经验觉得球场看台上的各色杂乱像素点是观众,所以只要把看台椅子涂成各种颜色,电视机前的人就会以为球场观众席满坑满谷,不过这就是另一个话题了。

所以综上所述,就我观察,现在的AI至多只能做到像素层面的识别和模仿,因为有意识的辩识能力是需要联想的,这属于人类智慧的一部分,除非AI拥有了智慧,否则突破不了这层桎梏。

而只能做到像素识别能力的AI,根本无法满足较为复杂的需求和创作,自然也就代替不了人,代替不了需要较高识别能力的中高层绘画工作。

  • 3
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值