来源: AINLPer公众号(每日干货分享!!)
编辑: ShuYini
校稿: ShuYini
时间: 2024-3-9
该数据集由Google发布,是一个用于评估和训练多语言数学问题解答能力的基准。具体来说,该数据集由250个来自GSM8K(Grade School Math 8K)的问题组成,这些问题通过人工注释者翻译成了10种不同的语言。GSM8K本身是一个包含8500个高质量、语言多样的小学数学文字问题的集合,旨在支持需要多步推理的基本数学问题的问答任务。
这个数据集适用于开发和测试多语言问答系统,尤其是在教育技术领域,可以帮助开发能够理解和解答不同语言数学问题的AI系统。MGSM数据集为研究者提供了一个平台,以探索和改进多语言自然语言处理(NLP)模型在数学问题解答方面的表现。
相关数据集与论文获取,GZ: AINLPer公众号 回复:MGSM数据集