医疗文本数据集-nlp

 

1. CCHMC

数据来自辛辛那提儿童医院医学中心放射科(Cincinnati Children s Hospital Medical Center’s Department of Radiology,CCHMC)。CCHMC的机构审查委员会批准了数据的发布。采用bootstrap方法对所有门诊x线胸片和再胸片进行为期一年的采样(Walters, 2004)。这些数据是最常用的数据之一,它们的设计提供了足够的代码来涵盖儿科放射学活动的实质比例。为了达到HIPAA标准,消除歧义包括三个步骤:消除歧义。

 

 

2. MIMIC

麻省理工学院计算生理学实验室开发的一个公开可用的数据集,包括与约40,000名重症监护患者相关的未识别的健康数据。它包括人口统计、生命体征、实验室检测、药物治疗等。最新版本的MIMIC是MIMIC- iii v1.4,包括38645名成年人和7875名新生儿的5.8万多所医院入院。数据跨度为2001年6月至2012年10月。

  • 2
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值