rwkv4的测试数据集

rwkv4测试数据集

1、arc基准测试(https://opendatalab.com/OpenDataLab/ARC/tree/main)

一个为多项选择题回答而设计的数据集,包括从三年级到九年级的科学考试问题。它有简单和挑战子集,我们分别报告结果。

2、BoolQ Dataset (https://github.com/google-research-datasets/boolean-questions)

BoolQ 是一个包含 15942 个示例的是非问题问答数据集。这些问题都是自然发生的——它们是在无提示和无约束的环境中生成的。

3、XCOPA(https://github.com/cambridgeltl/xcopa)

跨语言合理替代方案选择数据集是评估机器学习模型跨语言传输常识推理能力的基准。该数据集是英语COPA(Roemmele 等人,2011 年)的翻译和重新标注,涵盖 11 个语系和全球多个地区的 11 种语言。

4、HEDD-QA(https://huggingface.co/datasets/dvilares/head_qa)

HEAD-QA 是一个多选题的医疗保健数据集。这些问题来自西班牙医疗保健系统中专业职位的考试,即使对于高度专业的

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值