语义分割任务常用的评价指标为Dice coefficient和mIoU。dice和Iou都是用来衡量两个集合之间相似性的度量,对于语义分割任务而言即用来评估网络预测的分割结果与人为标注结果之间的相似度。接下来将分别介绍两者之间的区别和联系。
0. 二分类的评价指标
在介绍语义分割评价指标之前,先回顾一下分类算法的评价指标,混淆矩阵,accuracy,precision和recall,以及F1-score这5个指标。
混淆矩阵(confusion matrix)
如上图所示,包含一个二分类的混淆矩阵和一个例子。对于一个二分类任务,可能出现如下四种情况:
- TP:表示一个样本被预测为正类,并且真实标签为正类
- FN:表示一个样本被预测为反例,但是真实标签为正例
- FP:表示一个样本被预测为正例,但是真实标签为反例
- TN:表示一个样本为预测为反例,并且真实标签为反例
上述四个标识的理解可以通过从右到左读取,即第一个表示为预测结果,第二个字母表示是否预测正确。举例:FP-第一个字母为P,即表示预测结果为positive(正例),第二个字母为F,即表示预测错误,那么表示原本真实标签应该是反例。
Accuracy(准确率)
表示预测正确的样本数量占全部样本的百分比,具体表示如下:
缺点:当数据类别分布不平衡时,不能评价模型的好坏。
Precision(查准率)
表示模型预测为正例的所有样本中,预测正确(真实标签为正)样本的占比:
Recall (查全率)
表示所有真实标签为正的样本,有多大百分比被预测出来
F1-score
表示precision和recall的调和平均数,具体公式如下:
1. 语义分割的评价指标
dice系数概念理解
dice系数是一种集合相似度度量函数,通常用于计算两个集合之间的相似度,取值范围在【0,1】之间,函数表达式如下:(分子乘以2是为了保证分母重复计算后取值范围在【0,1】之间)
IoU
定义:两个集合之间交集与并集之间的比值,函数表达式如下:
2. 语义分割和分类之间的联系与区别
- 联系:语义分割任务本质上是分类任务
- 区别:常规分类任务的对象是图像中的物体,而语义分割的对象是图像中像素点。
通过上面可知,语义分割本质是分类,因此评价分割算法的好坏,其混淆矩阵的获取是最关键的。
如下图所示,假设在一种图像中,有一块72个像素点的区域标记为猫,一个70个像素点的区域标记为狗,然后通过网络推理得到结果,构建了如下的混淆矩阵。基于这个混淆矩阵分析,对评价指标像素准确率(Pixel Accuracy, PA),类别像素准确率(class Pixel Accuracy, CPA),类别平均像素准确率(MPA)和平均交并比(mIoU)分别进行分析。
PA: 像素准确率
含义:预测正确的像素值占总像素值的百分比(对应于分类中的准确率)
计算公式:
CPA: 类别像素准确率
含义:在所有预测为类别i的像素点中,真实属于类别i的像素点所占的百分比(对应于分类的precision指标)
计算公式:
MPA:类别平均像素准确率
含义:所有类别像素准确率之和的平均。
计算方法:首先求得每个类别的像素准确率,然后对它们求和再平均。
IoU: 交并比
含义:某个类别预测结果与真实标签之间交集与并集之间的比值
计算公式(如上图所示):
MIoU:平均交并比
含义:每个类别预测结果与真实标签之间交集与并集的比值,求和再平均。
Dice系数
根据上述dice系数的定义,换算到混淆矩阵可以得到如下公式:
参考链接
医学影像分割---Dice Loss - 知乎 (zhihu.com)https://zhuanlan.zhihu.com/p/86704421语义分割之dice loss深度分析(梯度可视化) - 知乎 (zhihu.com)https://zhuanlan.zhihu.com/p/269592183Dice系数(Dice coefficient)与mIoU与Dice Loss_lipengfei0427的博客-CSDN博客_dice系数https://blog.csdn.net/lipengfei0427/article/details/109556985【语义分割】评价指标:PA、CPA、MPA、IoU、MIoU详细总结和代码实现(零基础从入门到精通系列!)_西北种田文的博客-CSDN博客https://blog.csdn.net/sinat_29047129/article/details/103642140