计算机医学图像数据集汇总

一、肺结节数据集

计算机辅助诊断(CAD)主要是指基于医学影像学的计算机辅助技术。CAD 被视为医生的“第三只眼”,其广泛应用有助于提高诊断的敏感性和特异性。近年来,基于深度学习技术基础并利用海量医学影像数据的完备性优势,使得临床诊断精度得到很大的提高。本文针对肺节结数据集、乳腺 MG 数据集等进行介绍,文中列出的一些常用的不同类型医学影像数据库地址链接包括:
http://www.cancerimagingarchive.net
https://grand-challenge.org
https://github.com/beamandrew/medical-data

1.1 天池医疗 AI 大赛数据集

数据集地址:https://tianchi.aliyun.com/competition/introduction.htm?raceId=231601

数据由天池医疗 AI 大赛与合作机构LinkDoc 授权提供。全部数据集有 3000 例病人,数据集样本示例如图 1 所示。数据集中所有 CT 影像的层厚小于 2mm,全部都有肺节结。
全部数据集的数据格式有 CT 影像 mhd 格式(mhd 文件具有包含关于患者 ID 的必要信息,以及诸如切片厚度的扫描参数等)和 CSV 节结标注文件。每个图像中的结节都给出了中心坐标和半径。难点之一在于结节的判断容易和其他血管的影像混淆。

1.2 LIDC-IDRI 数据集

数据集地址:https://wiki.cancerimagingarchive.net/display/Public/LIDC-IDRI
该数据集是由美国国家癌症研究所(National Cancer Institute)发起,由七个学术中心和八家医学影像公司合作创建。全部数据集由临床胸部 CT 等扫描的图像和相关的 XML 标注文件组成。该数据集中,共收录了 1018 个研究实例。
对于每个实例中的图像,都由 4 位专业的放射科医师进行两阶段的诊断标注。在第一阶段,每位医师分别独立诊断并标注病患位置,其中会标注三中类别:①结节≥3mm;②结节<3mm;③非25结节≥3mm。在第二阶段,医师都独立的复审其他三位医师的标注,并给出自己最终的诊断结果。

2. 乳腺 MG 数据集

2.1 INbreast 数据集

数据集地址 http://medicalresearch.inescporto.pt/breastre-search/index.php/Get_INbreast_Database
INbreast 数据集是一个乳房 X 射线造影图像数据集。数据集来自葡萄牙波尔图乳腺中心医院。INbreast 数据集中包含 115 病例(共 410 张图像),其中 90 病例是双乳房数据(每例 4 张图像),25 病例是乳房切除患者的数据(每例 2 张图像)。INbreast 数据集包括 4 种类型的病变(肿块,钙化,不对称和扭曲)。专家标记的这些数据样本,其精确病症轮廓信息都记录在 XML 格式文件中。

2.2 DDSM 数据集

数据集地址:http://marathon.csee.usf.edu/Mammography/Database.html
该数据集包含大约 2500 个研究病例,每个病例包括每个乳房的两幅图像,以及一些相关的患者信息(年龄,ACR 乳房密度等级,异常的精确评级和异常的 ACR 关键字描述)以及图像信息(扫描仪,空间分辨率等)。包含可疑区域的图像已经关联了包含可疑区域位置和类型的像素级“Ground Truth”信息。用于筛查乳房 X 射线造影的数字数据库被编组为“病例”和“卷”。“病例”是与一名患者的一次乳房 X 射线检查相对应
的图像和信息的集合。
每个病例由 6 到 10 个文件组成,分为四类:①“ics”文件:包含图像相关信息,如患者年龄,图像的大小,是否存在用于异常轮廓叠加的文件等;②“16-bit PGM”文件:真实乳房 X 射线造影图像文件;③“ljpeg”文件:包含四个使用无损 JPEG 编码进行压缩的图像文件;④“overlay”文件:给出每个视图中给定异常的关键字描述,而正常情况下不会有任何叠加的文件。

2.3 MIAS 数据集

数据集地址:http://peipa.essex.ac.uk/pix/mias/all-mias.tar.gz
该数据集中的乳房X射线造影图像是由英国国家乳腺筛查计划中心精细挑选,并进行数字化(分辨率为 ,这是一种线性光学密度描述)。该数据集包含 161 名患者的左右乳房图像,由 322个图像组成,其包含三种类型:正常 208 个,良性 63 个和恶性(异常)51 个。该数据集包括放射科专业医师对任何可能存在异常的位置标记“Ground Truth”。对于每个病例文件给出它们的类型,位置,大小等其它有用信息。根据这些专家标注的描述,该数据库包括四种异常(结构畸变,星状病变,腺瘤肿块和钙化病变)。该数据集标注文件为 info.txt,其标注信息包含以下信息:①类型:四种异常;②分类:异常是恶性还是良性;③位置和大小:异常的原始坐标和直径。

  • 2
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值