“你画的啥玩意儿?” -- Google 工程师解释 “猜画小歌” 的基本原理

Hi,大家好,我是承香墨影!

前几天 Google 出了个热门刷屏小程序“猜画小歌”,相信大家都玩过。刚火的时候我就和朋友打赌,看这个小程序能火几天,有人说三天有人说一周,到现在已经慢慢在朋友圈归于平静,相信已经有人解锁所有的关键词,反正我是没画全。

前两天发了一篇关于猜画小歌反编译的文章,有兴趣先可以看看。

网上也有很多通关教程,可事实上,有时候我们按照别人"正确"的答案去临摹,最终可能也让 AI 说一句“你画得啥玩意儿?”。

是 AI 不够智能吗?其实不全是,AI 并不是完全依赖你最终画出的内容进行匹配猜测,另外一个很重要的依据是你画画的笔触顺序

这是因为对于大部分来说,画某一个特定的东西,笔画都会很自然的依靠本能的按照某个顺序去画。

例如:画章鱼大部分人肯定是先画头再画触手,这是一个比较符合人类习惯的,AI 也比较容易识别。而当你刻意的反向绘画的时候,先画触须再画头,虽然画出的最终效果可能是一样的,但此时 AI 的识别成功率就会降低很多。

Quick,Draw!

“猜画小歌”的前身是一款 Web App,Quick,Draw!,基本上是将 Quick Draw 的玩法,照搬到微信小程序上了。

@美国疯传 媒体也邀请了 Quick,Draw 的主要研发人员,来讲解它的原理。

就是这个小哥和大叔,后面我们还会看到他们。

AI 如何识别

在这里,我们想画一个鞋子。

在图中,AI 会同步根据你绘画的内容进行匹配,直到找到匹配的物品关键字。

如果简单的只是手绘某个物品,例如图中绘制的鞋子,其实只需要按照最终成型的手绘图,即可进行判断。那么通过笔触顺序进行识别的意义在哪里呢?

这就要说到识别文字,如果是中文这样的方块字,AI 的识别,就需要依赖笔触的顺序进行识别。它不仅要知道你画的是什么,还要看看你是如何画的,第一笔是什么,之后笔触的顺序如何。

例如这里绘制一个 “武” 字,想要识别它,顺序就尤为重要了,哪怕是徒手写的 Look ,也需要通过笔触顺序来区分到底是 Look 还是 Book。

AI 不仅仅是根据你画的最终效果图来识别,它其实还会根据你画图的笔触顺序来进行识别,并且这是一个主要的识别依据。

最后跳出文字,再来看看绘制一些手绘的简笔画,对人类来说,画一只猫,可能会从多个角度来画,这对人类来说,识别起来很容易。

但是对于机器来说,并没有这么容易,一个是猫头、一个是身子另外一个是猫的面部,它们都代表了猫咪本身,但是对于机器而言,却是三个完全不同的画。想要机器能够正确的识别猫,就需要给他看很多关于猫的涂鸦,它会发现其中的规律,看的越多,它才能越准确。

小结

如果你临摹的画 猜画小歌 识别不了,可以考虑一下是不是你画笔的顺序有违常人。

不过猜画小歌的意义也不能简单的理解为一个游戏,它更多的想通游戏的形式,让大家了解 AI,就像我们说的,AI 很聪明,可以帮我们做很多事,但是它又不够聪明,无法做到所有的事情。AI 没那么神奇也没那么智障。

AI 发展的越好,基础算法和设施就会越完善,准入门槛也会越低,发展到最后肯定就是拼的创意、想法和数据。

所以理解它,想想它能干什么?边界在哪里?这些就是猜画小歌对我们的意义。欢迎在留言区讨论。


联机圆桌」????推荐我的知识星球,一年 50 个优质问题,上桌联机学习。

公众号后台回复成长『成长』,将会得到我准备的学习资料,也能回复『加群』,一起学习进步;你还能回复『提问』,向我发起提问。

推荐阅读:

Android P 适配经验 | 技术创业选择清单 | HTTP传输编码 | 什么正在消耗你? | HTTP 内容编码 | 图解 HTTP 缓存 | 聊聊 HTTP 的 Cookie | 辅助模式实战 | Accessibility 辅助模式 | 小程序 Flex 布局 | 好的 PR 让你更靠谱 | 密码管理之道

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值