正如我们上文提到的那样,我们可以通过小样本对SAM模型进行微调,那么我们需要获取有关息肉的数据集,我们应该选用什么数据集呢。
一、kvasir-SEG数据集
市面上和息肉有关的数据集并不太多,比较出名的有如kavasir-SEG数据集
Kvasir-SEG是一个针对结肠息肉像素级分割的内窥镜数据集,举办过MediaEval 2020的比赛。它包括1000张胃肠息肉图像及其对应的分割掩码,这些图像都由资深胃肠病专家亲自标注和核实。官方数据仓库按880:120的比例提供了训练和验证的数据划分,以公正地比较各种方法。此数据集旨在推动结肠息肉的分割、检测、定位和分类方法的研究和创新。
我们可以将kvasir-SEG数据集当作我们的一个数据集。
我们可以进入kvasir-SEG的官网对数据集进行下载。
二、CVC-ClinicDB数据集
CVC-ClinicDB 是MICCAI 2015 结肠镜视频自动息肉检测子挑战赛训练阶段的官方数据集。该数据库由从结肠镜检查视频中提取的612张静态图像组成,这些图像来自29个不同的序列。每张帧图像都附带有一个真值(ground truth)掩码,用于标识图像中息肉所覆盖的区域。当涉及到结肠镜检查和消化道肿瘤筛查时,息肉分割具有重要的意义。通过将医学影像中的息肉与周围正常组织进行分离,可以提供更清晰的视觉参考,帮助医生准确地确定息肉的位置、形状和大小。这对于初步评估息肉的性质(良性或恶性)以及制定相应的治疗计划至关重要。
C
CVC-ClinicDB数据集的获取:我们可以进入官网对CVC-ClinicDB数据集进行下载。
三、老师提供的数据集
这里要特别感谢老师给我们提供非常精良且非常庞大的数据集,这是老师与医院合作仅用于科研的数据集,因此我们就不在此对数据集进行过多的讲解了,我们在后续的工作中也主要是使用此数据集。