AI数学家:求解高级数学问题的机器学习算法


全文共1514字,预计学习时长4分钟

图源:unsplash

 

你试过建立一个神经网络模型来解决简单的数学问题吗?比如两个数的乘法或一个数的平方?

 

如果有,那么你可能会意识到神经网络模型并不是用来解决这些简单问题的。你通过一个相对复杂的模型得到类似一个数的平方的问题,这也不尽人意。

 

今天,在任何尖端技术中,数字的精确性非常重要。结果的一个微小变化可能会导致部署人工智能的系统出现极大的故障。并不是说不能通过建立一个近乎完美的端到端神经网络模型来直接回答数学问题,而是说,这样完全没有必要。

 

相反,我们可以使用人工智能来理解数学问题或给定问题的数学部分,然后通过机器的运算单元来解决它。这将是解决数学问题最简单、最可靠的方法,甚至在神经网络模型中嵌入一个运算单元也可能有效。虽然目前尚不确定是否存在这样的模型,但今天将深入研究一个能够将复杂问题转化为简单解决方案的模型。

 

Facebook人工智能的序列到序列(seq2seq)转换模型可以解决上述问题。实际上,这是使用符号推理简化高级数学方程。他们声称该模型是第一个这样做的模型,在解决积分问题和微分方程方面比传统计算系统更加有效。

 

树形数学

 

假设一个方程b-4ac=12。

 

这些变量不能直接加、减或乘。因此,求解此类方程需要处理符号数据的能力。研究人员开发了一种将数学表达式看作语言中句子的方法,这使得他们能够利用神经机器翻译(NMT)中的成熟技术来训练模型,以解出这些复杂的方程。

 

因此,研究人员开发了一种将现有数学表达式分解为类语言语法的方法,还生成了一个包含超过1亿个大规模训练对方程和解的数据集。

 

图源:量子杂志

 

首先,他们开发了一种有效将方程组解压成树状结构的方法。现在这个结构可以转换成序列,与序列到序列(seq2seq)模型一起使用。相较于一种语言的句子,数字和变量类似于名词,而运算符号和函数类似于动词。对于方程式4x²+sin(3x)-2,顺序如下——加,乘,4,幂,x,2,减,正弦,乘,3,x,2。

 

研究人员随后生成了一组约1亿对方程和解的数据集。这些数据被输入一个有8个注意头和6层的序列到序列(seq2seq)变压器模型。为了测试模型的性能,研究人员为模型提供了5000对不可见的方程组,这些方程组不存在于训练数据集中。

 

图源:Facebook 人工智能博客

 

该模型求解积分问题的精准度为99.7%,一阶、二阶微分方程的精准度分别为94%和81.2%。这些结果是研究人员测试的其他三种传统方法(Maple、Mathematica和Matlab)中最好的,也是最快的,在不到半秒钟的时间内返回大多数解,而其他方法则需要几分钟时间,甚至更多。

 

对于给定的输入,该模型还能够提供多种简化解决方案,这与翻译输入句在许多方面类似。但是这种模型目前只能解决一个变量的问题,研究人员正计划开发该模型来求解多变量方程组。同时还建议,这种方法可以应用于如物理这样的数学和逻辑基础领域。


推荐阅读专题

留言点赞发个朋友圈

我们一起分享AI学习与发展的干货

编译组:麻宸菲、符馨元

相关链接:

https://medium.com/towards-artificial-intelligence/deep-learning-algorithms-for-solving-advanced-mathematical-problems-719467a394e8

如转载,请后台留言,遵守转载规范

推荐文章阅读

ACL2018论文集50篇解读

EMNLP2017论文集28篇论文解读

2018年AI三大顶会中国学术成果全链接

ACL2017论文集:34篇解读干货全在这里

10篇AAAI2017经典论文回顾

长按识别二维码可添加关注

读芯君爱你

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值