来源: AINLPer公众号(每日干货分享!!)
编辑: ShuYini
校稿: ShuYini
时间: 2024-2-28
该数据集由Allen Institute for Artificial Intelligence(AI2)发布,旨在推动高级问答的研究。该数据集包含7787个中学水平的自然科学问题。这些问题分为挑战集(2590个问题)和简单集(5197个问题),并以选择题形式呈现。数据集被划分为训练集、开发集和测试集,并提供CSV和JSON格式。此外,AI2还发布了一个包含1400万科学相关句子的语料库,以及三个神经网络基线模型,以帮助研究者开始解决问题。这些模型在简单集上表现良好,但在挑战集上未能显著超越随机基线,显示了任务的难度。
相关数据集与论文获取,GZ: AINLPer公众号 回复:ARCC数据集