图像分割中通常使用许多标准来衡量算法的精度。这些标准通常是像素精度及loU的变种,以下我们将会介绍常用的几种逐像素标记的精度标准。为了便于解释,假设如下:共有k+1个类(从 L 0 L_0 L0到 L k L_k Lk,其中包含一个空类或背景), p i j p_{ij} pij表示本属于类i但被预测为类j的像素数量。 p i i p_{ii} pii表示识别正确的样本数量,而 p i j p_{ij} pij和 p j i p_{ji} pji则为识别错误的样本数量。
Pixel Accuracy(PA,像素精度)
这是最简单的度量,为标记正确的像素占总像素的比例。
Mean Pixel Accuracy(MPA,均像素精度)
计算每个类别内被正确分类像素数的比例,之后求所有类的平均
Mean Intersection over Union(MloU,均交并比)
为语义分割的标准度量,计算两个集合的交集和并集之比。在语义分割的问题中,这两个集合为真实值(ground truth)和预测值(predicted segmentation)。每个类上计算loU,之后平均。
举个栗子,图像分割是不规则的边缘,简化下假设是矩形的边缘
考虑i=0时,为Dog的类别,A为预测框,B为真实标注框
p
i
i
p_{ii}
pii为图中绿色区域,当i=j=0时,预测值是Dog真实值也是Dog;
p
j
i
p_{ji}
pji为图中A区域,当i=j=0时预测正确,指的是绿色区域。当i不等于j时预测错误,指的是蓝色区域;
p
i
j
p_{ij}
pij为图中B区域,当i=j=0时预测正确,指的是绿色区域。当i不等于j时预测错误,指的是黄色区域。
Frequency Weighted Intersection over Union(FWloU,频权交并比)
是对MloU的改进,对每个类别按照重要性进行加权,重要性来自于其出现的频率
总结
在以上所有的度量标准中,MloU由于其简洁、代表性强而成为最常用的度量标准,大多数研究人员都使用该标准报告其结果。