二分类中的混淆矩阵中有以下4种标记:
预测(列)/label(行) | 正样本 | 负样本 |
---|---|---|
正样本 | TP(真正例) | FN(假反例) |
负样本 | FP(假正例) | TN(真反例) |
TP(真正例) :将正样本预测为正样本
FN(假反例):将正样本预测为负样本
FP(假正例):将负样本预测为正样本
TN(真反例):将负样本预测为负样本
说明:后面的字母表示预测结果,前一个字母表示是否预测正确
precision:表征分类器的分类效果(查准效果),它是在预测为正样本的实例中预测正确的频率值,故,
P
=
T
P
T
P
+
F
P
P = \frac {TP}{TP+FP}
P=TP+FPTP
recall:表征某个类的召回(查全)效果,它是在标签为正样本的实例中预测正确的频率,故:
R
=
T
P
T
P
+
F
N
R=\frac{TP}{TP+FN}
R=TP+FNTP
f1值:即用来衡量precision和recall的值,它是这个两个值的调和均值,其中,
F
=
(
1
+
a
2
)
P
R
a
2
(
P
+
R
)
,
当
a
=
1
时
即
F
1
−
s
c
o
r
e
F=\frac{(1+a^2)PR}{a^2(P+R)},当a=1时即F1-score
F=a2(P+R)(1+a2)PR,当a=1时即F1−score
举个例子
label | 0 | 0 | 1 | 0 | 1 | 1 | 0 | 1 | 0 | 1 |
---|---|---|---|---|---|---|---|---|---|---|
predict | 1 | 0 | 1 | 0 | 0 | 1 | 0 | 0 | 0 | 1 |
TP:真正例:即将正样本预测为正样本, 3
TN:真反例:即将负样本预测为负样本,4
FP:假正例:将负样本预测为了正样本,1
FN:假反例:将正样本预测为了负样本,2
所以P=3/(3+1)=0.75,R=3/(3+2)=0.6,f1=2×0.75×0.6/(0.75+0.6)=0.67