CholecSeg8k数据

CholecSeg8k是一个8080帧的腹腔镜胆囊切除术图像数据集,从Cholec80提取,包含13个类别标签。数据集用于内窥镜语义分割,每个图像有颜色和分水岭掩码,旨在支持计算机辅助手术算法的开发。数据集按视频片段组织,提供注释工具使用的掩码和颜色掩码。CholecSeg8k基于CC BY-NC-SA 4.0许可发布,可在Kaggle上获取。
摘要由CSDN通过智能技术生成

About Data:内窥镜语义分割

一.介绍

计算机辅助手术的发展是为了提高手术的正确性和安全性。然而,研究人员和工程师在开发和训练更好的算法时,要忍受有限的注释数据。因此,诸如同步定位与映射(SLAM)等基础算法的发展受到了限制。本文阐述了为语义分割准备数据集的工作,这是许多计算机辅助手术机制的基础。基于Cholec80数据集[1],我们从Cholec80的17个视频片段中提取了8080个腹腔镜胆囊切除术图像帧,并对图像进行了注释,并向公众发布。该数据集名为CholecSeg8K。每个图像都在像素级别上标注了13个类,这些类通常在腹腔镜胆囊切除术手术中建立。CholecSeg8k基于CC BY-NC-SA 4.0 license发布。

二.数据收集

CholecSeg8K数据集使用由CAMMA(医学活动计算分析和建模)研究小组提供的Cholec80[1]的内窥镜图像作为基础。该研究小组与斯特拉斯堡大学医院、斯特拉斯堡IHU和IRCAD合作构建了该数据集。Cholec80包含了由13名外科医生进行的胆囊切除手术的80个视频。Cholec80中的每个视频以25fps的速度捕捉过程,并注释了工具的存在和操作阶段。我们的工作选择了Cholec80提供的视频的一个子集,并在所选视频的提取帧中创建语义分割掩码。

三.数据细节

为了更好地组织和访问,CholecSeg8K数据集中的数据被分组到一个目录树中。第一级树上的每个目录表示从Cholec80提取的视频剪辑,并以视频剪辑的文件名命名。二级树上的每个目录存储80帧视频剪辑的原始图像数据、注释和颜色掩码。该目录根据原始视频片段的文件名和提取的视频片段的起始帧索引命名。

这些帧被提取并放置到目录中,每个目录包含80个连续的视频帧,分辨率为854x480,带有注释的语义分割掩码。总共有101个目录,总帧数为8080。不同物体的类别总数为13类,包括黑色背景、腹壁、肝脏、胃肠道、脂肪、抓手、结缔组织、血液、囊管、L钩电灼(仪器)、胆囊、肝静脉、肝韧带。在这个数据集中,并不是所有13个都在同一时间出现在同一帧中。

在数据集中,每帧都有三个掩码,一个颜色掩码,一个注释工具使用的掩码,以及一个分水岭掩码。彩色蒙版主要用于可视化。分水岭掩码包含具有更简单像素读数的对象,即三个通道的值相同,以便于处理。这些值是注释工具中类的id。注释工具使用另一个掩码,即注释期间手绘的掩码,生成颜色掩码和分水岭掩码。标签有彩色掩模和分水岭掩模两种。分水岭掩码将类的ID存储为所有三个通道的像素值。颜色遮罩将类绘制成不同的颜色。id和颜色在注释工具中定义。

四.标签数据的例子

表I显示了图1、2、3中类号对应的类名,以及分水岭掩码中的RGB十六进制代码
Class Number Class Name RGB hexcode
Class 0 Black Background #505050
Class 1 Abdominal Wall #111111
Class 2 Liver #212121<

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值