#今日论文推荐# ACL-2022 | 字节跳动与新加坡科技与设计大学提出：基于演绎推理的数学解题

研究动机
作为一类需要解题的推理过程，在数学解题任务中比较适合应用演绎推理模型。我们尝试在此任务上做一些多步的推理 (multi-step reasoning)，使得模型预测能够提供相对可解释的预测结果。
问题描述
在给定一个数学问题的情况下，我们进行算术解答并得到答案。Question: In a division sum , the remainder is 8 and the divisor is 6 times the quotient and is obtained by adding 3 to the thrice of the remainder. What is the dividend?
Answer: 129.5Mathematical Expression: （（8×3+3）×（8×3+3）÷6）+8
上面的这个（取自于 MathQA [3] dataset）例子中，我们需要得到最后被除数 (dividend) 129.5。同时数据集也给出计算的表达式，可以用来当作监督信号。这种多步的表达式，也便于验证 multi-step reasoning 的方法。这边我们也主要考虑一些基本的数学运算符，包括加 (＋) 减 (-) 乘 (×) 除 (÷) 以及幂 (^)，其他更复杂的运算其实可以分解成这些基本的运算。
现有方法
目前流行的数学解题方法主要是 sequence-to-sequence (Seq2Seq) 以及 sequence-to-tree (Seq2Tree) 的方法。针对 Seq2Seq 的方法，优点是简单直接，缺点是需要有非常大量的数据才得到好的效果，否则效果不如结构化模型 Seq2Tree。Seq2Tree 主要的代表工作是 Goal-Driven Tree-Structure (GTS) [4]，目前也是大家比较频繁借鉴的工作。同时 Seq2Tree 也有可以改进的地方，如下图所示，生成的过程是一个前序遍历 (pre-order traveral) 的过程，会先生成顶端的数学运算符 (operator)，然后是 operator 左边的运算，最后是右边的运算。生成的过程相对来说比较不符合直觉，并不是一个一步步计算的过程。此外，我们可以看到同一个表达式 8×3+3 被生成了 2 次，然而我们其实是可以重复使用这个表达式的结果。但在 Seq2Tree 的方法中，我们无法这样去使用，必须重新生成整个子树结构。

论文题目：Learning to Reason Deductively: Math Word Problem Solving as Complex Relation Extraction
详细解读：https://www.aminer.cn/research_report/629eb9467cb68b460fcc3949?download=false
AMiner链接：https://www.aminer.cn/?f=cs