本文是LLM系列文章,针对《Large Language Models for Mathematical Reasoning: Progresses and Challenges》的翻译。
摘要
数学推理是评估人类智力基本认知能力的基石。近年来,面向数学问题自动解决的大型语言模型(LLM)的发展出现了显著的激增。然而,数学问题类型的范围是广泛而多样的,面向LLM的技术正在不同的数据集和环境中进行评估。这种多样性使得辨别这一新兴领域的真正进步和障碍具有挑战性。这项调查致力于解决四个关键维度:一)对已调查的各种数学问题及其相应数据集的全面探索;ii)对已经提出用于数学问题解决的面向LLM的技术的范围的检查;iii)影响数学解题LLM的因素和关注点概述;以及iv)阐明该领域内持续存在的挑战。据我们所知,这项调查是对数学领域LLM前景的首次广泛考察之一,为这个快速发展的领域的现状、成就和未来挑战提供了一个全面的视角。