前言
在介绍个精度指标前我们先来明确以下几个概念,对应的示意图如下图所示:
- TP(True Positive):分类准确的正类,意思是预测结果为正类,实际上是正类。
- FP(False Positive):被错分类为正类的负类,意思是实际为负类,但是却被预测为正类。
- TN(True Negative):分类准确的负类,意思是预测结果为负类,实际上是负类。
- FN(False Negative):被错分类为负类的正类,意思是实际为正类,但是却被预测为负类。
精度指标
1 精确率
精确率(Precision)就是被准确分类为正类的样本数与所有被分类为正类的样本数之比,意味着预测结果是正类的样本里具体有多少个样本真的是正类,计算方法如下式所示:
2 召回率
召回率(Recall)就是被分为正类的样本数与测试数据集中的实际正类的样本数之比,意味着应该被分为正类的样本中会有多少是被正确分类出来,如下式所示:
3 F1分数
我们希望精确率和召回率同时非常高。但实际上这两个指标是一对矛盾体,无法做到双高。如果想要找到二者之间的一个平衡点,我们就需要一个新的指标:F1分数(F1-Score)。F1分数同时考虑了查准率和查全率,让二者同时达到最高,取一个平衡。
4 交并比
交并比(Intersection-over-Union, IoU)是指实际类别样本和预测类别样本的交集和并集之比,即分类准确的正类样本数和分类准确的正类样本数与被错分类为负类的正类样本数以及被错分类为正类的负类之和的比值。
5 平均交并比
平均交并比(mean Intersection-over-Union, mIoU)是对每一类交并比求和平均的结果。
6 频权交并比
频权交并比(Frequency Weighted Intersection-over-Union, FWIoU)是根据每一类出现的频率设置权重,权重乘以每一类的IoU并进行求和。
<