来源: AINLPer公众号(每日干货分享!!)
编辑: ShuYini
校稿: ShuYini
时间: 2024-3-3
先进的语言模型可以在许多任务上与人类表现相媲美,但它们仍然难以执行多步骤数学推理任务。为此OpenAI团队创建了一个高质量、语言多样化的小学数学题数据集GSM8K,旨在旨在评估模型在多步数学推理上的性能表现,并支持相关研究。
具体来说,该数据集包含了8.5K(8500)个问题,这些问题都是由标注工作人员自己编制的,并且分为7.5K个训练问题集和1K个测试问题集。这些问题的解决通常需要2到8步,主要涉及使用基本的算术运算(加、减、乘、除)来达到最终答案,一个聪明的中学生应该能够解决每一个问题。
相关数据集与论文获取,GZ: AINLPer公众号 回复:GSM8K数据集