甲状腺结节检测数据集 1800张 甲状腺 带标注 voc yololabel| pic_ _num
标签 | box_ num
benign:(874,1578)
malignant: (1008, 1272)
total:(1882,2850)
这个甲状腺结节检测数据集是一个医学影像数据集,专门用于训练和评估机器学习模型来识别甲状腺结节,并区分良性(benign)和恶性(malignant)结节。该数据集包含1800张带有标注的超声图像,总共1882个图像样本(可能有些图像含有多个结节),并标记了2850个边界框。
数据集详情
- 良性结节 (Benign):874个图像样本,总共1578个边界框。
- 恶性结节 (Malignant):1008个图像样本,总共1272个边界框。
- 总计:1882个图像样本,总共2850个边界框。
这些图像通常来自于临床环境中的超声检查,每个结节都被手动或半自动地标记出边界框。这样的标注对于训练监督学习模型至关重要,特别是基于深度学习的目标检测算法,如YOLO、Faster R-CNN等。
数据格式
数据集的标注信息遵循PASCAL VOC和YOLO标准。这意味着每个图像都有对应的XML文件(VOC格式)或者文本文件(YOLO格式),其中包含了结节的位置信息(边界框坐标)、类别标签(良性/恶性)以及其他元数据。
VOC 格式示例
xml
深色版本
<annotation>
<folder>thyroid</folder>
<filename>image001.jpg</filename>
<size>
<width>640</width>
<height>480</height>
<depth>3</depth>
</size>
<object>
<name>benign</name>
<bndbox>
<xmin>100</xmin>
<ymin>150</ymin>
<xmax>300</xmax>
<ymax>350</ymax>
</bndbox>
</object>
<object>
<name>malignant</name>
<bndbox>
<xmin>400</xmin>
<ymin>200</ymin>
<xmax>500</xmax>
<ymax>400</ymax>
</bndbox>
</object>
</annotation>
YOLO 格式示例
深色版本
0 0.15625 0.3125 0.375 0.5625
1 0.625 0.4167 0.625 0.8333
每行代表一个对象,数字0
表示良性结节,1
表示恶性结节,接下来的四个数值分别表示边界框中心点的x坐标、y坐标以及宽度和高度,都是相对于图像尺寸的比例值。
应用场景
- 辅助诊断:帮助医生快速定位和分类甲状腺结节,提高诊断效率。
- 研究工具:为研究人员提供一个标准化的数据集,以开发和测试新的算法和技术。
- 教育用途:作为教学材料,帮助医学生了解甲状腺结节的特征及其在影像学上的表现。
使用该数据集的关键步骤
- 数据预处理:将数据转换成适合所选框架的格式,例如YOLO或Faster R-CNN。
- 模型选择与配置:选择合适的深度学习模型,并根据任务需求调整模型参数。
- 训练模型:使用标注好的数据集进行模型训练。
- 验证与测试:通过验证集调整模型性能,最终在测试集上评估模型效果。
- 部署应用:将训练好的模型集成到实际应用中,如医院的信息系统或移动设备。