在深度学习语义分割中,评估模型性能的指标有多种,每种指标衡量模型在不同方面的表现。以下是常用的语义分割评估指标及其详细解释:
1. 交并比( Intersection over Union, IoU)
是最常用的语义分割评价指标,也称为指数。它衡量的是预测分割结果与真实分割结果的重叠程度。
TP (True Positive): 真正例,正确预测为目标类别的像素数
TN(True Negative):真负例,正确预测为非目标类别(背景)的像素数
FP (False Positive):假证例, 错误将非目标类别预测为目标类别的像素数
FN (False Negative): 假负例,错误将目标类别像素预测为非目标类别的像素数
2. 平均交并比(mean Intersection over Union, mIoU)
是所有类别的平均值,用于多类别分割任务。计算方式为对每个类别的求平均:
其中,是类别总数, 是第个类别的。
3. 全像素准确率(Pixel Accuracy, PA)
衡量模型在所有像素上预测的准确性,即预测正确的像素占总像素的比例:
4.平均精度(Mean Pixel Accuracy, MPA)
平均精度是针对每个类别计算的全像素精度的平均值。
5.精确度(Precision)
精确度是正确预测为正类的像素数与预测为正类的总像素数的比值。
6.召回率(Recall)
召回率是正确预测为正类的像素数与实际正类的总像素数的比值。
7.F1分数(F1 Score)
F1分数是精确度和召回率的调和平均值。
8. 类别平均准确率(Class Average Accuracy, CA)
是对每个类别的准确率求平均,用于衡量模型在每个类别上的均衡表现:
9. 加权全像素准确率(Frequency Weighted Intersection over Union, FWIoU)
考虑了每个类别在数据集中出现的频率,以加权的方式计算平均:
其中, 是第个类别的像素数占总像素数的比例。
10. Dice系数(Dice Coefficient)
系数也是衡量重叠度的指标,与类似,但更强调重叠部分:
11. Kappa系数(Kappa Coefficient)
系数用于衡量预测结果与真实结果之间的一致性,考虑了偶然一致的情况:
: 实际观测到的一致性,: 偶然一致的概率
这些指标可以根据不同的任务需求组合使用,以全面评估语义分割模型的性能。和是最常用的指标,尤其在多类别分割任务中,具有良好的区分度和直观性。