PubMedQA生物医学研究问题解答数据集(2019)下载

PubMedQA是从PubMed摘要中收集的新颖的生物医学问答(QA)数据集。PubMedQA的任务是使用相应的摘要以是/否/可能的方式回答研究问题(例如:术前他汀类药物是否能减少冠状动脉搭桥术后的房颤?)。

PubMedQA具有1k专家注释,61.2k未标记和211.3k人工生成的QA实例。每个PubMedQA实例均由

(1)一个问题(既可以是现有研究文章的标题,又可以是从其中得出的问题)组成;
(2)上下文是没有其结论的相应摘要;
(3)长答案,即摘要,大概可以回答研究问题;
(4)是/否/也许是答案,总结了结论。

PubMedQA是第一个QA数据集,需要对生物医学研究文本进行推理,尤其是其定量内容才能回答问题。我们性能最佳的模型是BioBERT的多阶段微调,具有长答案词袋统计作为额外的监督,可实现68.1%的准确性,相比之下,单个人的性能为78.0%的准确性和多数基准为55.2%的准确性,有很大的改进空间。

作者: Qiao Jin, Xinghua Lu

备注:EMNLP 2019

论文:https://arxiv.org/abs/1909.06146

官网:https://pubmedqa.github.io/

官方下载

https://github.com/pubmedqa/pubmedqa

百度网盘

链接: https://pan.baidu.com/s/1P5oIbyq3p6er71v3DFRFxg 提取码: 47y7

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值