目录
3. 划分数据集为训练集+测试集 split_data.py
1. 流程介绍
注:原始的数据只有 DATASET/ TCGA 患者样本
项目的文件结构如图所示:
1.1 数据集介绍
DATASET 是下面的 TCGA 是原始数据,每个文件夹都是一个病人的样本
随机一个目录打开如图所示:
mask 全黑代表没有病样,所以对本章分割的项目是属于无效的数据
因此,需要将数据进行预处理,将有病例的image和label取出,放到DATASET下的TCGA_image 和
目录
3. 划分数据集为训练集+测试集 split_data.py
注:原始的数据只有 DATASET/ TCGA 患者样本
项目的文件结构如图所示:
DATASET 是下面的 TCGA 是原始数据,每个文件夹都是一个病人的样本
随机一个目录打开如图所示:
mask 全黑代表没有病样,所以对本章分割的项目是属于无效的数据
因此,需要将数据进行预处理,将有病例的image和label取出,放到DATASET下的TCGA_image 和