语义分割-前言

momodic

已于 2024-03-25 19:54:24 修改

阅读量708

点赞数 15

分类专栏：语义分割文章标签：深度学习图像处理

于 2024-03-22 15:25:29 首次发布

本文链接：https://blog.csdn.net/momodic/article/details/136941907

版权

语义分割专栏收录该内容

2 篇文章 0 订阅

订阅专栏

本文为作者观看B站up主霹雳吧啦Wz，深度学习-语义分割篇-第一节语义分割前言课程的笔记总结，欢迎大家指正、讨论。

视频原地址
 语义分割系列视频
 霹雳吧啦老师的csdn账号

文章目录

语义分割任务常见数据集格式

PASCAL VOC

在这里插入图片描述

通道数为1 （单通道）
每一个像素对应不同的颜色

如像素0对应(0, 0, 0) 黑色

像素1对应(127, 0, 0) 深红色

像素255对应(224, 224, 129)

MS COCO

在这里插入图片描述

针对图像中的每一个目标都记录了多边形坐标:
在这里插入图片描述

语义分割得到结果的具体形式

在这里插入图片描述

每个像素数值对应类别索引。

例如说：上图中类别‘person’ 对应的像素为15，会显示为上图中的颜色。

在Pascal VOC数据集中各目标类别名称与类别索引对应关系：

{
	"background": 0,
    "aeroplane": 1,
    "bicycle": 2,
    "bird": 3,
    "boat": 4,
    "bottle": 5,
    "bus": 6,
    "car": 7,
    "cat": 8,
    "chair": 9,
    "cow": 10,
    "diningtable": 11,
    "dog": 12,
    "horse": 13,
    "motorbike": 14,
    "person": 15,
    "pottedplant": 16,
    "sheep": 17,
    "sofa": 18,
    "train": 19,
    "tvmonitor": 20
}

常见语义分割评价指标

在这里插入图片描述

Pixel Accuracy = 预测正确的像素个数 / 总像素个数
Mean Accuracy = 各个类别预测的准确率总和 / 总目标类别个数
每个类别的IoU = 正确预测类别 $i$ 的像素个数 / (类别标签为 $i$ 的像素个数+预测为类别 $i$ 的像素个数 - 正确预测类别 $i$ 的像素个数）
Mean IoU = 各个类别的IoU总和 / 总目标类别个数