LUNA16数据集简介

1. 简介

1.1 介绍

LUNA16,全称Lung Nodule Analysis 16,是16年推出的一个肺部结节检测数据集。数据集包括 888 个低剂量肺部 CT 影像(mhd格式)数据,每个影像包含一系列胸腔的多个轴向切片。每个影像包含的切片数量会随着扫描机器、扫描层厚和患者的不同而有差异。原始图像为三维图像。每个图像包含一系列胸腔的多个轴向切片。

LUNA16 数据集是最大公用肺结节数据集 LIDC-IDRI 的子集,LIDC-IDRI 它包括 1018 个低剂量的肺部 CT 影像。LIDC-IDR I删除了切片厚度大于 3mm 和肺结节小于 3mm 的 CT 影像,剩下的就是 LUNA16 数据集了。

1.2 网站

比赛官网:https://luna16.grand-challenge.org/

官方论文:Validation, comparison, and combination of algorithms for automatic detection of pulmonary nodules in computed tomography images: the LUNA16 challenge

🔶 数据集下载

百度云:https://pan.baidu.com/s/1OvwNP26SvupMoQmK49aD7w?pwd=sy93
提取码:sy93

CT影响

2. 组成

下载后文件包含

|--CSVFILES
|	|--annotations.csv
|	|--annotations_excluded.csv
|	|--candidates.csv
| 	|--sampleSubmission.csv
|	|--seriesuids.csv
|--seg-lungs-LUNA16
|--subset0~9 包含10个子集,每个大约有90个CT扫描,总共888个
|	|--xxx.mhd:
|	|--xxx.raw:

2.1 candidates.csv

包含所有可能看起来像结节的肿块信息,无论这些肿块是恶行肿瘤、良性肿瘤还是其他。

统计文件中的行数:

$ wc -l candidates.csv
551066 candidates.csv

输出文件的前几行:

$ head candidates.csv
seriesuid,coordX,coordY,coordZ,class
1.3.6.1.4.1.14519.5.2.1.6279.6001.100225287222365663678666836860,-56.08,-67.85,-311.92,0
1.3.6.1.4.1.14519.5.2.1.6279.6001.100225287222365663678666836860,53.21,-244.41,-245.17,0
1.3.6.1.4.1.14519.5.2.1.6279.6001.100225287222365663678666836860,103.66,-121.8,-286.62,0
1.3.6.1.4.1.14519.5.2.1.6279.6001.100225287222365663678666836860,-33.66,-72.75,-308.41,0
1.3.6.1.4.1.14519.5.2.1.6279.6001.100225287222365663678666836860,-32.25,-85.36,-362.51,0
1.3.6.1.4.1.14519.5.2.1.6279.6001.100225287222365663678666836860,-26.65,-203.07,-165.07,0
1.3.6.1.4.1.14519.5.2.1.6279.6001.100225287222365663678666836860,-74.99,-114.79,-311.92,0
1.3.6.1.4.1.14519.5.2.1.6279.6001.100225287222365663678666836860,-16.14,-248.61,-239.55,0
1.3.6.1.4.1.14519.5.2.1.6279.6001.100225287222365663678666836860,135.89,-141.41,-252.2,0

每行都有 seriesuid,coordX,coordY,coordZ,class

  • Seriesuid:文件的唯一标识
  • X, Y, Z:结节的坐标
  • 类别:0 表示非结节,1表示结节(恶行或良性)

一共有 1351 个候选结节被标记为结节。

2.2 annotations.csv

包含一些已标记为实际结节的候选者的信息

查看文件有多少行:

$ wc -l annotations.csv
1187 annotations.csv

输出文件前几行:

$ head annotations.csv
seriesuid,coordX,coordY,coordZ,diameter_mm
1.3.6.1.4.1.14519.5.2.1.6279.6001.100225287222365663678666836860,-128.6994211,-175.3192718,-298.3875064,5.651470635
1.3.6.1.4.1.14519.5.2.1.6279.6001.100225287222365663678666836860,103.7836509,-211.9251487,-227.12125,4.224708481
1.3.6.1.4.1.14519.5.2.1.6279.6001.100398138793540579077826395208,69.63901724,-140.9445859,876.3744957,5.786347814
1.3.6.1.4.1.14519.5.2.1.6279.6001.100621383016233746780170740405,-24.0138242,192.1024053,-391.0812764,8.143261683
1.3.6.1.4.1.14519.5.2.1.6279.6001.100621383016233746780170740405,2.441546798,172.4648812,-405.4937318,18.54514997
1.3.6.1.4.1.14519.5.2.1.6279.6001.100621383016233746780170740405,90.93171321,149.0272657,-426.5447146,18.20857028
1.3.6.1.4.1.14519.5.2.1.6279.6001.100621383016233746780170740405,89.54076865,196.4051593,-515.0733216,16.38127631
1.3.6.1.4.1.14519.5.2.1.6279.6001.100953483028192176989979435275,81.50964574,54.9572186,-150.3464233,10.36232088
1.3.6.1.4.1.14519.5.2.1.6279.6001.102681962408431413578140925249,105.0557924,19.82526014,-91.24725078,21.08961863

与 candidates.csv 相比,最后一列不同,表示结节的直径。

需要注意的是,annotations.csv 文件提供的位置信息并不总是与 candidates.csv 中的坐标精确对齐。

  • 12
    点赞
  • 33
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
LUNA16是一个肺结节检测和分类的数据集,主要用于肺结节的研究和算法评估。在使用pytorch搭建分类网络进行疑似肺结节分类之前,需要进行样本集的生成。 生成样本集的步骤如下: 1. 安装cuda11.4和cudnn8.2.4,这是为了支持GPU加速计算。 2. 创建一个虚拟环境并安装Python 3.8。 3. 使用pip安装pytorch和相关的库,可以采用命令"pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu114"安装。 4. 下载nnDetection项目,并将LUNA16的数据文件夹存放在项目的"Task016_Luna/raw"目录下。 5. 运行预处理脚本"prepare.py",该脚本将LUNA16原始的.raw格式数据转换为.nii.gz格式,并根据annotations.csv中提供的结节信息构造结节的标签信息和mask数据。 6. 进行尺度归一化操作,确保样本的尺度一致。 以上是使用pytorch搭建LUNA16肺结节分类网络的准备工作,接下来可以根据需要进行深度学习模型的训练和评估。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* [nnDetection复现Luna16 附模型](https://blog.csdn.net/qq_29304033/article/details/128140704)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *3* [实战:使用Pytorch搭建分类网络(肺结节假阳性剔除)](https://blog.csdn.net/qq_24739717/article/details/101034728)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

望天边星宿

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值