什么是语义分割
可以理解为分类任务,对每个像素进行分类。
全景分割:将背景也划分出来。
暂定的学习规划
常见的数据集格式
PASCAL VOC
png图片的p模式是什么意思?
在PNG图像格式中,"p"模式通常是指调色板(palette)模式,也称为索引颜色(indexed color)模式。
在调色板模式中,图像使用调色板来存储颜色信息,而不是直接存储像素的RGB值。调色板是一个包含一系列颜色的列表,每个颜色都有一个唯一的索引号。图像中每个像素的颜色信息都存储为该像素在调色板中的索引号。
调色板模式可以大大减小图像文件的大小,因为它使用更少的比特来存储颜色信息。但是,调色板模式的颜色数量通常是有限的,因此不适用于需要大量颜色的图像,例如照片。它通常用于图标、标志和简单的图形等具有少量颜色的图像。
所以图片是单通道的。
对于目标边缘和一些其他不好分割的地方,我们用白色(255)填充,计算损失的时候就会忽略它们。
MS COCO
因为将每个物体的信息都给出了,也可以做实例分割。
得到结果的形式
如果直接以灰度图片显示,就是浅灰和深灰的区别。所以用调色板。
评价指标
Nii:类别i被预测成i的像素个数。
视频中对这三个评价指标举例说明很清楚。
标注工具
作者都有csdn博文的。
Labelme
手动标注。
EISeg
百度飞桨的产品。
半自动的标注工具。
感觉不错。