DeepMind在数学游戏中获胜

e5dce2a0be99bebe65abd5fbc167150b.jpeg

━━ 

━━

一项新研究指出,谷歌的兄弟公司DeepMind的人工智能系统偶然发现了一种新的方法,可以解决现代计算的核心数学问题。研究人员表示,该系统的性能优于已有50多年没有得到改进的算法。

该方法涉及修改DeepMind的AlphaZero,AlphaZero是一款击败了国际象棋和围棋大师的游戏引擎。其工作原理是被称为矩阵的数字网格相乘,这也是处理图像、识别语音命令、训练神经网络、运行天气预测仿真和在互联网上压缩共享数据的关键运算。

“发现新的矩阵乘法算法可能有助于加快这些应用的速度。”该研究的主要作者、DeepMind的研究科学家阿尔胡赛因•法兹(Alhussein Fawzi)说,DeepMind是谷歌母公司Alphabet的子公司,总部位于伦敦。

一对2×2的矩阵相乘,标准技术需要8步。1969年,德国数学家沃尔克•斯特拉森(Volker Strassen)提出了一种方法,只需要7步。法兹说,减少一个步骤,效率就会高很多,但几十年来,没有人能够将斯特拉森的算法突破应用到更大的矩阵乘法,哪怕是一对3×3的矩阵。“我从一开始就感觉到,机器学习在这个领域有很大的帮助,可以发现最佳模式,即矩阵中结合哪些条目和如何结合这些条目,从而获得正确的结果。”

214daa42f60c8df92d563806ba3041a2.jpeg

在新研究中,法兹及其同事研究AI如何帮助自动发现新的矩阵乘法算法。他们以斯特拉森的研究为基础,该研究侧重于将矩阵乘法张量的3D数组分解为基本分量。

为掌握国际象棋、围棋和其他游戏,科学家开发了AlphaZero,在此基础上,他们又开发了名为AlphaTensor的AI系统。他们将分解张量的问题转化为一个单人游戏,并训练AlphaTensor找到赢得比赛的有效方法。

法兹的团队指出,该游戏极具挑战性。AlphaTensor必须考虑的算法数量远远超过宇宙中原子的数量,即使对小规模矩阵乘法来说也是如此。在一个场景中,游戏的每一步

都有超过

1033种可能的 走法。

“搜索空间是巨大的。”法兹说。

AI系统在开始运行时并不知道现有的矩阵乘法算法。通过反复玩游戏并从结果中学习,它逐步改进提升。法兹说:“对于矩阵乘法这样的基础任务,AlphaTensor是首个发现新颖、高效且正确的算法的AI系统。”

该系统最终发现,它检验过的每种尺寸的矩阵中都有数千个矩阵乘法算法,说明矩阵乘法算法的领域比以往想象得更丰富,其中包括比已知算法更快的算法。例如,AlphaTensor发现了一种算法,完成4×4矩阵只需47步,改进了已有50年历史的斯特拉森算法(需49步)。

法兹回忆道:“第一次看到我们能够改进已知算法,我们非常激动。”

这些新的算法具有不同的数学特性和许多潜在的应用。为了发现可在给定硬件设备(例如英伟达V100 GPU或谷歌TPU v2)上快速运行的算法,科学家们修改了AlphaTensor。他们发现,在相同硬件上,进行大矩阵相乘的算法比常用算法快10%到20%。

法兹说:“AlphaTensor提供了一个重要的概念验证,即借助机器学习,我们能超越现有的最先进算法,因此,机器学习将在未来的算法发现领域中发挥基础作用。相信在未来几年里,我们将在机器学习的帮助下发现许多新算法,用于日常的基础计算任务。”

最初,AlphaTensor对其处理的问题一无所知。这提出了一个有趣的未来方向,或许可以将其与嵌入相关问题的数学知识相结合,“这将有可能使系统进一步扩展。”法兹说。

此外,法兹说:“我们还想将AlphaTensor应用到计算机科学的其他基础运算中。计算机科学和数学中的许多问题与我们研究中的问题有相似之处,因此我们相信自己的论文将有所帮助,未来在机器学习的助力下,数学和计算机科学领域将产生新的结果。”

科学家们于2022年10月5日在《自然》杂志上详细介绍了该项研究成果。

作者:Charles Q. Choi

490a7a73344e2f62476bf678a5535227.jpeg

IEEE Spectrum

《科技纵览》

官方微信公众平台

d9a1d684a8823109c9e52aded8435050.jpeg

往期推荐

马克思的数学手稿

埃隆 • 马斯克的“智能游戏”

来自下方的电源,埋入式互连装置将帮助拯救摩尔定律

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值