定义
- 略。通过看书对于这两个指标自己是掌握了的,但是时间一长容易弄混淆,所以索性从例子的角度去理解这两个指标。
- 对于
精确率
需要看预测值
来确定分母
,对于召回率
看样本
确定分母
。如果记忆的话就是 P r e c i s i o n < − − − > P r e d i c t Precision<--->Predict Precision<−−−>Predict,两者都是以P开头,至于分子就是找出和分母一样的值的个数,这里具体说的是什么可以看下面的例子,然后自己想一想,应该有深切体会。 - 另外,关于各种参考资料中写的正负样本在实际使用工程中都是自己定义的,在使用过程中需要根据自己的需要决定。
计算方式
给定的如下的样本值和相应的预测值,并假设T为正样本,N为负样本
sample label: N、N、T、T、N、T、N、T、T、T、N
predict label: N、N、N、T、T、T、N、T、T、N、N
则
P
r
e
c
i
s
i
o
n
=
4
5
Precision=\frac{4}{5}
Precision=54,其中分母表示将5个样本预测为T,分子表示有4个预测对了;
R
e
c
a
l
l
=
4
6
Recall=\frac{4}{6}
Recall=64,其中分母表示真实样本中有6个T,分子表示找到了4个T;
关系
这两个指标是没法同时变大的,就上面这个例子来说,
- 如果将predict label全部预测为T,则召回率可以达到 100 % 100\% 100%,但是精确率却会变低;
- 如果使用模型时对于样本的置信度高的离谱,才将其预测为T,则有很大的概率使得精确率变成 100 % 100\% 100%,而这种情况下召回率肯定会很低。
F1
顺利成章的,既然精确率和召回率作为单一的评估指标都不合适,所以
F
1
F1
F1这种同时考虑了两种指标的评估方法被提了出来,即两种指标的调和平均数。
F
1
=
2
1
P
r
e
c
i
s
i
o
n
+
1
R
e
c
a
l
l
=
2
×
P
r
e
c
i
s
i
o
n
×
R
e
c
a
l
l
P
r
e
c
i
s
i
o
n
+
R
e
c
a
l
l
F1=\frac{2}{ { \frac{1}{Precision} }+{ \frac{1}{Recall} } }=\frac{2\times{Precision}\times{Recall}}{Precision+Recall}
F1=Precision1+Recall12=Precision+Recall2×Precision×Recall