人工智能的“能”与“不能”

文章探讨了人工智能的现状和挑战,强调了AI在游戏、翻译等领域的应用主要基于算力而非理解,真正的理解和通用人工智能仍需解决许多难题。作者通过《AI3.0》中的观点,提醒读者理性看待人工智能的发展,指出机器在特定领域的高效率并不等同于真正的智能。
摘要由CSDN通过智能技术生成

人工智能的“能”与“不能”

前言

对于人工智能,我懂的只是皮毛而已。但是,人工智能(AI,Artificial Intelligence)已经在很多方面融入到人类的生活中了,这迫使我们不得不去了解人工智能。AI也是现在最火热的话题,自然语言生成式大模型、视频生成式大模型不断地刷新人类认知,AI的更新迭代速度之快,加上媒体和营销号的吹嘘,甚至某些公众人物的口嗨,某种程度上会给人带来一点点恐慌。

人工智能究竟是怎么一回事,我认为最好的方式就是慢慢了解它,然后理性地看待它。AI能做什么,不能做什么,我们可以参考人工智能研究人员的看法。前段时间看了《AI3.0》这本书,由美国波特兰州立大学计算机科学教授梅拉妮·米歇尔2019年著,由王飞跃等人翻译,2021年2月出版中文版。这本书写作时,大语言模型还未暴露在公众视野,书中对人工智能的论述放在大模型如此火热的现在仍然适用。并且,这本书的内容深入浅出,基本不需要AI基础也能看懂,内容也很有趣味性。

本文分享的内容来自《AI3.0》的序:《等那一口仙气儿》,人给机器吹一口仙气儿,机器就有灵魂了吗?问题恐怕没那么简单。

人工智能的“能”与“不能”

用人工智能算法练习打游戏,是挖掘算法潜能、理解算法机理的有效途径。智能算法打游戏基本是无监督学习的过程,典型的比如《打砖块》游戏,人不能事先给机器注入太多游戏策略,或者有利于获胜的先验知识,只能把游戏规则灌输给算法,剩下的就全看机器自己的“修炼”了。

通过前面的简要分析,大家理解了 ConvNets 中最重要的是参数调节,在游戏领域就是机器的游戏策略选择。事先存储再多的游戏策略,在暴力算法面前其实也是不堪一击的,这其实是 AlphaZero 最终完胜人类的奥秘。人类棋手或者游戏玩家的“功力”往往来自经验,也就是人们积攒的大量的套路,这些套路只是针对某个封闭对弈空间的有限选择。如果机器只会模仿人的经验策略,它就不能获得独立应对意外局面的能力,机器必须进入更大的对弈空间,这就是强化学习的含义。例如查德·萨顿(Richard Sutton)所言,强化学习就是“从猜测中学习猜测”,米歇尔将其调整为“从更好的猜测中学习猜测”。

分析到这一步,其实就十分接近人工智能的核心问题了。什么是“更好的猜测”?智能机器目前所能做的,还只是“最快的猜测”,或者说“以快取胜”。目前的人工智能,往往在速度上卓尔不凡,因为它可以动辄在更大的博弈空间里处理海量的数据,表现出令人咂舌的算力水平,远远超过人类的计算能力。这种能力在让人惊艳的同时,也带有很强的迷惑性,使人误以为机器已经“沾了仙气”,比如IBM的智能机器沃森就是如此。其实这是假象,如今的人工智能,与真正的人工智能之间依然有巨大的鸿沟。什么是真正的人工智能?业界对其定义也一直争论不休,这里暂且不论。

人工智能的核心问题,依然涉及对客体对象、目标过程的认识。真正的人工智能必须有能力认识某一对象是什么。人工智能专家所找到的解决之道,其实还远不是“认识对象”的解决之道。而是找到一个退而求其次的路径,就是“目标函数”的构建。

目标函数是什么?举个例子,比如玩蒙眼点鼻子的游戏。蒙眼人拿着笔走向一副大鼻子卡通画,然后摸索着去点画中的鼻子。如果有个声音不停地提示其偏离的方向,蒙眼人就可以很快地点中鼻子。这个提示点鼻子的偏差信息,对蒙眼人点中鼻子至关重要。想象让机器来完成这个任务,机器可以不理解什么是鼻子,什么是点,也不用明白这么做有什么娱乐的价值,但如果能给出判断点中与否的目标函数,就可以大大提高机器成功完成任务的概率。

其实,当下的人工智能算法依然停留在工程意义上,也就是说,还只是以完成任务为目标。至于做这件事的意义,则全然不在机器算法的“视野”之内。

谷歌的 AlphaGo 到 AlphaGo Zore 的演化过程,就是一个活生生的例子。第一阶段,AlphaGo 向人学习,第二阶段,AlphaGo Zore 自学成才。不管哪个阶段,谷歌公司的创见在于:让算法可以洞察整个盘面。为了大大减少计算的负担,并使算法可以获知距离获胜还有多远,他们使用的是蒙特卡洛方法,只要确保最优策略依然在剩下的搜索空间里就好,换句话说,比对手多预测几步就有更大的胜算。

从游戏中学习套路,人工智能是不是就早晚可以超越人类?在人工智能刚刚兴起的20世纪五六十年代就有这个论调,当年在机器上玩跳棋的亚瑟·塞缪尔(Arthur Samuel)曾乐观估计,10年内机器必然战胜人类。今天的机器算法,固然已经在棋类博弈中完胜人类棋手,但从智能角度看,与那时相比其实并无实质性的进步。也就是说,无论机器的自学能力有多强,有一件事是确定的,即游戏目标的存在。游戏规则和游戏目标作为先验知识,给出了这样一个明确的博弈边界,即这一游戏的博弈空间是有穷空间。算法的唯一目标就是赢,不管其对手是人还是另一个机器算法,也不管对弈双方是否理解游戏,或者能否欣赏游戏之美,它只追求赢。棋类游戏博弈中的“赢”,其实隐含一个假设,即游戏本身是存在赢的可能性的,比如在围棋中,平局、和棋也是“输赢”的特定形态。换句话说,就是一个有趣的、有输赢的游戏设计,其本身先天地规定了这一静态目标的成立——零和博弈。

因此,机器在零和博弈空间里完胜人类这一点,并非凸显了机器智能超群,只是进一步验证了人类的局限性和零和博弈目标的有限性。除此之外,机器所取得的成功说明不了更多。

从视觉系统和游戏,并不能看出人工智能所面临的最大的挑战在哪里。人工智能所面临的最大挑战,可能在于人们忘记了智能机器的强项依然是算力,错误地选择将今日之人工智能更多地用于人类增强中,而且将人机联合的活动空间,定义为更大的零和博弈游戏场景。

米歇尔很好地说明了这一挑战下的另一个场景,就是人工智能所面临的一个“硬核”场景:机器翻译。

早在1956年达特茅斯会议提出人工智能之前,在20世纪40年代美国“科技工业共同体”建设中扮演重要角色的官方技术官员沃伦·韦弗博士就提出了机器翻译的理念。机器翻译既是特别有市场号召力的应用场景,也是检验人工智能技术思想所取得的前沿突破的重要领域,谷歌、微软、科大讯飞等公司在这方面投入了巨大的热情。机器翻译无疑是最“硬核”的人工智能难题,它难在人工智能需要直接面对“理解”这一难题。谷歌和微软等公司还将翻译的含义拓展,用智能算法给图片打标签,试图解决海量图片的识别问题,斯坦福大学开发了人工智能阅读理解项目,希望有一天能够让机器“读懂”它所面对的内容。

就在我写这篇文章的时候,长期关注生物科技、人工智能、区块链等领域的前沿进展的企业家邵青博士,给我发来一篇来自美国硅谷的报道,这则报道的主角叫作 GPT-3 算法,GPT-3 是硅谷领先的人工智能公司 OpenAI 开发的第三代语言模型。这一模型的神奇之处在于,它通过分析网络上的海量文字,来预测哪些单词更可能会跟随在另一些单词的后面。让许多程序员兴奋不已的是,GPT-3被开放给所有程序员公测。

相应的报道使用了这样的表述:GPT-3竟然能直接理解自然语言。从报道中看,所谓理解自然语言,就是你可以用语音向算法提任何问题,然后它就可以给你呈现你想要的。比如你说“给我一个长得像Stripe官网的聊天App”,过几秒钟,定制好的App就推送过来了,像点餐一样方便。还不止这些,GPT-3还可以写论文、小说,起草格式合同,甚至大批量生成段子。当然,也有评论不客气地指出,GPT-3根本不懂自然语言,它只是很快而已。它的确太快了,据说有1750亿个参数,我们姑且认为他可以处理如此巨量的参数吧。

但是,这其实依然是一种使用蛮力进行计算的模式,仅此而已。

对于目前的自然语言项目,我可以武断地说,它们其实毫无“理解”可言,它们唯一的本领就是“见多识广”。问题在于,虽然一款智能机器可以快速遍历状态空间的更多可能性,把边边角角都扫描到,然后表现出越来越多令人惊讶的本领,甚至超过人类的表现,但是,它们依然像是“狗眼看星星”,并不认得什么叫“星图”。

小结

人工智能的发展速度是惊人的,能力也越来越强大,但很多人对人工智能的预估仍然过于乐观了,甚至是激进的。人工智能与人类智能当前还有非常大的差距,包含但不限于以下几方面:

1.对于专用的AI,如AlphaGo在最难的棋类游戏上战胜了人类,体现的其实是AI的算力,用强化学习在更大的空间中寻找更好的解。但是AlphaGo只会下围棋,如果要让它下五子棋,则必须把围棋的能力“遗忘”,用新的数据重新训练下五子棋的能力。

2.对于现在GPT这种生成式的大模型,它的泛化能力和涌现能力确实非常强大,其实体现的也是强大的算力,大模型都依赖巨量的参数。大语言模型主要是预测当前内容后面更可能跟随的其他内容,它并不“理解”内容的真正含义,所以会“一本正经地胡说八道”,在专业领域也经常犯错。

3.对于机器翻译这样的AI,现在已经非常实用了,并且也越来越准确,但是机器并不“理解”自然语言表达的意义,如果把一段话在两种语言之间来回翻译两三次,如把一段英文翻译成中文再翻译回英文,表达的意义经常已经不是原来的意义,对于那些小语种更是。

当前,人工智能与人类智能最大的差距之一就是“理解”,在生成式大模型“眼里”,自然语言是按概率和相关性拼接文字,图片是像素点拼接,视频是一帧帧图片拼接。它并不“理解”这些内容拼接在一起具有什么意义,也不“理解”图片的记录意义和制作视频的乐趣等,更不用说伦理道德和哲学等方面了。

我是拥护和看好人工智能的,对人工智能的发展和进步也是持正面态度,但是理性看待,人工智能要达到真正的通用人工智能,还需要解决非常多的难题,也需要很长的时间。

如果对《AI3.0》感兴趣,V联系我,我发给你。


参考文档:
[1] 《AI3.0》: A Guide for Thinking Humans,梅拉妮·米歇尔

相关阅读:

程序员都熟悉但不一定说得清的操作系统基本概念

📢欢迎 点赞👍 收藏⭐ 评论📝 关注 如有错误敬请指正!

☟ 学Python,点击下方名片关注我。☟

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小斌哥ge

非常感谢,祝你一切顺利。

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值