LUNA数据集是一个肺部肿瘤CT扫描结果的数据集,可用于作为肺癌检测的模型训练。
一、数据集下载
step1:登陆LUNA16官网,链接为:Home - Grand Challenge
step2:点击网站左侧【download】,进入下载页面。
step3:在download页面中,依次下载页面中两个链接的所有文件到本地。
二、数据集各文件内容
1. annotations.csv
文件每一行代表最终诊断为肿瘤的结节信息,其中:
series_uid:CT扫描结果的编号。每个series_uid代表一个CT扫描结果,可能包含多个结节。
coordX~Z:肿瘤的中心XYZ坐标。
diameter_mm:肿瘤的直径,单位为毫米。
2. candidates.csv
文件每一行为初步判断可能为肿瘤的结节信息。其中:
series_uid:CT扫描结果的编号。每个series_uid代表一个CT扫描结果,其中可能包含多个结节。
CoordX~Z:coordX~Z:肿瘤的中心XYZ坐标。
class:结节初步判断的类别。0为正常结节,1为肿瘤。
3. subset
数据集一共10个子集,分别存放在文件夹subset0~subset9。每个subset存放着以series_uid命名的CT文件。其中【mhd】为头文件,存放CT的一些参数配置信息,【raw】为数据文件,存放CT扫描数据。