#今日论文推荐# ACL-2022 | 字节跳动与新加坡科技与设计大学提出:基于演绎推理的数学解题

#今日论文推荐# ACL-2022 | 字节跳动与新加坡科技与设计大学提出:基于演绎推理的数学解题

研究动机
作为一类需要解题的推理过程,在数学解题任务中比较适合应用演绎推理模型。我们尝试在此任务上做一些多步的推理 (multi-step reasoning), 使得模型预测能够提供相对可解释的预测结果。
问题描述
在给定一个数学问题的情况下,我们进行算术解答并得到答案。Question: In a division sum , the remainder is 8 and the divisor is 6 times the quotient and is obtained by adding 3 to the thrice of the remainder. What is the dividend?
Answer: 129.5Mathematical Expression: ((8×3+3)×(8×3+3)÷6)+8
上面的这个(取自于 MathQA [3] dataset)例子中,我们需要得到最后被除数 (dividend) 129.5。同时数据集也给出计算的表达式,可以用来当作监督信号。这种多步的表达式,也便于验证 multi-step reasoning 的方法。这边我们也主要考虑一些基本的数学运算符,包括加 (+) 减 (-) 乘 (×) 除 (÷) 以及幂 (^),其他更复杂的运算其实可以分解成这些基本的运算。
现有方法
目前流行的数学解题方法主要是 sequence-to-sequence (Seq2Seq) 以及 sequence-to-tree (Seq2Tree) 的方法。针对 Seq2Seq 的方法,优点是简单直接,缺点是需要有非常大量的数据才得到好的效果,否则效果不如结构化模型 Seq2Tree。Seq2Tree 主要的代表工作是 Goal-Driven Tree-Structure (GTS) [4],目前也是大家比较频繁借鉴的工作。同时 Seq2Tree 也有可以改进的地方,如下图所示,生成的过程是一个前序遍历 (pre-order traveral) 的过程,会先生成顶端的数学运算符 (operator),然后是 operator 左边的运算,最后是右边的运算。生成的过程相对来说比较不符合直觉,并不是一个一步步计算的过程。此外,我们可以看到同一个表达式 8×3+3 被生成了 2 次,然而我们其实是可以重复使用这个表达式的结果。但在 Seq2Tree 的方法中,我们无法这样去使用,必须重新生成整个子树结构。

论文题目:Learning to Reason Deductively: Math Word Problem Solving as Complex Relation Extraction
详细解读:https://www.aminer.cn/research_report/629eb9467cb68b460fcc3949?download=false
AMiner链接:https://www.aminer.cn/?f=cs

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值