本文为作者观看B站up主霹雳吧啦Wz,深度学习-语义分割篇-第一节 语义分割前言课程的笔记总结,欢迎大家指正、讨论。
语义分割任务常见数据集格式
PASCAL VOC
-
通道数为1 (单通道)
-
每一个像素对应不同的颜色
如 像素0对应(0, 0, 0) 黑色
像素1对应(127, 0, 0) 深红色
像素255对应(224, 224, 129)
MS COCO
针对图像中的每一个目标都记录了多边形坐标:
语义分割得到结果的具体形式
每个像素数值对应类别索引。
例如说:上图中类别‘person’ 对应的像素为15,会显示为上图中的颜色。
在Pascal VOC数据集中各目标类别名称与类别索引对应关系:
{
"background": 0,
"aeroplane": 1,
"bicycle": 2,
"bird": 3,
"boat": 4,
"bottle": 5,
"bus": 6,
"car": 7,
"cat": 8,
"chair": 9,
"cow": 10,
"diningtable": 11,
"dog": 12,
"horse": 13,
"motorbike": 14,
"person": 15,
"pottedplant": 16,
"sheep": 17,
"sofa": 18,
"train": 19,
"tvmonitor": 20
}
常见语义分割评价指标
-
Pixel Accuracy = 预测正确的像素个数 / 总像素个数
-
Mean Accuracy = 各个类别预测的准确率总和 / 总目标类别个数
-
每个类别的IoU = 正确预测类别 i i i的像素个数 / (类别标签为 i i i的像素个数+预测为类别 i i i的像素个数 - 正确预测类别 i i i的像素个数)
-
Mean IoU = 各个类别的IoU总和 / 总目标类别个数
示例
根据以上真实标签和预测标签,绘制出下列统计矩阵:
根据统计矩阵,对各项指标进行计算:
-
计算Pixel Accuracy
-
计算每个类别的Accuracy
-
计算每个类别的IoU
对于类别0来说:
类别标签为0的像素个数 = 20
预测为类别0的像素个数 = 18
正确预测类别0的像素个数 = 16
语义分割标注工具
Labelme
Labelme工具对应博文:
https://blog.csdn.net/qq_37541097/article/details/120162702
EISeg
EISeg工具对应博文:
https://blog.csdn.net/qq_37541097/article/details/120154543