DEEP LEARNING FOR SYMBOLIC MATHEMATICS论文解读

m0_54283072

于 2023-10-14 21:40:38 发布

阅读量97

点赞数 1

分类专栏：深度学习智慧教育论文解读文章标签：深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_54283072/article/details/133831276

版权

深度学习同时被 2 个专栏收录

6 篇文章 0 订阅

订阅专栏

智慧教育论文解读

5 篇文章 0 订阅

订阅专栏

这篇论文提出了一种深度学习表示符号数学问题（尤其是函数积分问题和常微分方程问题）的语法，以及生成可用于训练seq2seq模型的大型数据集的方法。

一.数学可以当作自然语言

1.可以用树来表示数学表达式

树和表达式之间存在一对一的对应关系，其中树的内部节点是由算子（operator），函数（function）组成的，叶子节点由数字，变量，函数等组成。

2.可以用序列来表示树

tree-to-tree模型比它们的seq2seq模型更复杂，速度也慢得多。为了简单起见，我们使用seq2seq模型.

使用seq2seq模型生成树需要将树映射到序列。为此，我们使用前缀表示法(也就是我们数据结构中学的前缀表示法)，例如，2+ 3∗(5+ 2)可以表示为[+ 2 ∗ 3 + 5 2].为什么不用中缀呢？因为前缀表达式更短，因为它不需要括号。

表达式和树之间的一一对应，树和前缀序列之间也存在一对一的映射。

3.生成随机表达式

用相同的概率生成随机树和表达式，如图

4.计算表达式

二.生成数据集

原本想要随机生成函数积分和生成求解一阶和二阶常微分方程的问题，但是这样很可能造成生成的问题没有意义（比如有一些函数是不能积分的），所以需要一些生成数据集的方法。

首先在生成数据之前，作者对数据的范围进行了必要的限制：

数学表达式最多拥有 15 个内部节点；
L=11 表示叶子节点的值只有 11 个，分别是变量 x 和 {−5,−4,−3,−2,−1,1,2,3,4,5} ；
p1=15 表示一元计算只有 15 个，分别是
$\exp,\log,\sqrt,\sin,\cos,\tan,\arcsin,\arccos,\arctan, \sinh, \cosh, \tanh,\sinh^{-1},\cosh^{-1},\tanh^{-1}$
p2=4 表示二元计算只有四个，分别是

$+, -, *, /$

1.生成函数积分的方法

主要有：前向生成 (FWD)、反向生成 (BWD)、IBP逆向生成法。

前向生成(FWD)

主要思路就是在以上的数据范围内随机生成各种各样的方程 f，然后使用 SymPy 或者 Mathematica 等工具来计算函数 f 的积分 F，那么 (f,F) 就可以作为一个训练集。当然，有的时候函数 f 的积分是无法计算出来的，那么这种计算表达式就需要进行放弃，就不能放入训练集。

反向生成 (BWD)

由于积分是求导的逆运算，可以在以上的数据范围内随机生成各种各样的方程 f ，然后计算它们的导数 f′ ，于是 (f′,f) 就可以放入积分数据的训练集。

IBP逆向生成法

根据分部积分的公式来计算

$\int{F(x)g(x)}dx=F(x)G(X)-\int{f(x)G(X)}dx$

2.生成一阶微分方程及其解的方法

3.生成二阶微分方程及其解的方法

4.数据处理

数学表达式的简化（expression simplification）：例如 x+1+1 可以简化成 x+2 ，

$\sin^2(x)+\cos^2(x)$ 可以简化成 1
参数的简化（coefficient simplification）：
例如 $\log(x^2)+c\log(x)$ 可以简化成 $c\log(x)$
无效表达式的过滤（invalid expression filter）：
例如 $\sqrt2,\log(0)$ 等

树状结构的表达式，是使用前缀表达式来写成一个句子的。例如 2+3 就写成 + 2 3，2 + x 就写成 + 2 x。

三.进行实验

模型参数

利用上面的方法生成数据集，对于所有的实验，训练一个 seq2seq模型来预测给定问题的解，即预测给定函数的一个原函数，或给出微分方程的一个解。我们使用一个 transformer模型，它具有 8个注意力头，6层，维度为 512, 并且发现用更复杂的模型并没有提升其效果。

评价模型

模型的输出有可能与参考答案形式不同，但实质相同，因此使用 Sympy 对模型给出的预测和参考答案进行比较，来判定是否正确。使用准确率进行评价。

使用束搜索（Beam Search）提升测试性能

在预测的时候，使用不同的 Beam Size，其准确率是不一样的，在 Beam Size = 50 的时候，效果比较好。

与 Matlab、Mathematica 比较

数学软件超时的时候，视作求不出答案；并且不在 FWD（前向数据集）上进行比较（因为 FWD 本来就是软件求出来的，正确率是100%）。作者限制了 Mathematica 的运行时间为 30s

可以看到，有了束搜索的加持，模型的表现都比三款数学软件要好。

并且作者给出了一些数学软件无法求解而该模型可以正确给出答案的例子：

求解的等价性

可以根据 Score 逆序排列，作者发现模型给出的 top-n 预测结果一般都是同一个公式的不同形式，以下是一个例子。

泛化性能的研究

作者研究了在不同数据集（FWD, BWD, IBP）上训练的模型在其他数据集上的泛化性能：

并且，通过只训练 SymPy可以集成的函数，模型能够推广到 SymPy不能积分的函数：

结论

本文展示了标准的 seq2seq模型可以应用于困难的任务，如函数积分和求解微

分方程。本文提出了一种方法来生成任意大的数据集，以及它们的相关解决方案。并且证明，在这些数据集上训练的一个简单的 transformer模型在计算函数积分和求解微分方程

方面都可以表现得非常好，超过了最先进的数学框架，如 Matlab或 Mathematica，结果还表明，该模型能够以非常不同的方式编写相同的表达式。

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
DEEP LEARNING FOR SYMBOLIC MATHEMATICS论文解读

DEEP LEARNING FOR SYMBOLIC MATHEMATICS论文解读
复制链接

扫一扫

专栏目录

m0_54283072 CSDN认证博客专家 CSDN认证企业博客

码龄4年

21: 原创

124万+: 周排名

22万+: 总排名

5737: 访问

: 等级

234: 积分

18: 粉丝

21: 获赞

13: 评论

24: 收藏

私信

关注

热门文章

分类专栏

最新评论

203.移除链表元素
CSDN-Ada助手: 首先恭喜您撰写第20篇博客，“移除链表元素”，这是一个很不错的成就！您对链表操作的深入探讨让我受益匪浅。接下来，我建议您可以考虑深入研究链表的其他常见操作，比如插入、反转等，这样能够让您的博客内容更加丰富多彩。期待您更多精彩的创作！
A Survey of Deep Learning for Mathematical Reasoning论文解读
CSDN-Ada助手: 恭喜您能够撰写出如此深度的论文解读，对深度学习在数学推理方面的研究进行了全面的调研。希望您能继续保持创作的热情和努力，为读者带来更多有价值的内容。或许在下一篇博客中，您可以结合具体的案例或者应用场景，进一步展示深度学习在数学推理中的潜在应用和挑战，期待您的更多精彩内容。
59.螺旋矩阵II
CSDN-Ada助手: 恭喜您撰写了第19篇博客！标题中的“螺旋矩阵II”引起了我的兴趣。您的持续创作令人钦佩，希望您能继续保持这样的热情和努力。在下一步的创作中，我建议您可以考虑探索一些与螺旋矩阵相关的算法或者应用领域，这样能够更加丰富您的内容，让读者们从不同的角度了解螺旋矩阵。期待您的下一篇博客，谦虚地希望您能够继续分享您的知识和见解！
977.有序数组的平方
CSDN-Ada助手: “恭喜您写了第17篇博客！看到您一直持续创作，真是非常棒。关于有序数组的平方这个话题，您已经写得非常详细了。或许下一步可以考虑探讨一下不同排序算法对数组平方的影响，或者是数组平方在实际应用中的案例分析。希望能够给您一些新的创作灵感，期待您的下一篇博客！”
Visual Knowledge Tracing论文解读
CSDN-Ada助手: 非常恭喜您写了第16篇博客！标题“Visual Knowledge Tracing论文解读”听起来非常有趣和有价值。您对这个主题的深入研究和解读，无疑为读者提供了有关Visual Knowledge Tracing的宝贵见解。我希望您能继续保持创作的势头，并继续分享您对这一领域的独到观点和研究成果。同时，如果可能的话，我建议您在未来的博客中可以考虑添加一些实例或案例研究，以更加生动地展示Visual Knowledge Tracing的应用和效果。再次恭喜您，期待您未来更多精彩的创作！

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。