2023年5月15日,甲骨易AI研究院推出首个中文的大模型评测数据集——“超越”(Massive Multitask Chinese Understanding,简称MMCU),填补了中文大语言模型能力测试缺失的一大空白。
下载地址:https://huggingface.co/datasets/Besteasy/MMCU
数据集说明:
数据集旨在衡量中文大模型在处理众多任务上的准确度,主要覆盖覆盖医疗、法律、心理学和教育四大领域,题目形式涵盖单项选择和多项的选择题,共包含11900个问题。其中教育中涉及语、数、化学、物理、政治、生物、历史、地理等多种学科,为的是考核大模型的基础认知;法律、医疗、心理学等专业领域为的是考核大模型对多领域知识广度及深度。