这篇文章主要讲解一下机器学习中的几大评测指标
在读CTPN的论文时,遇到了Precision, Recall, F-measure三个概念
那么下面就简单从最开始的讲起
混淆矩阵
Postive | Negative | |
---|---|---|
True | True Positive(TP) | True Negative(TN) |
False | False Positive(FP) | False Negative(FN) |
TP: 正确识别为正样本
TN: 正确识别为负样本
FP: 错误识别为正样本
FN: 错误识别为负样本
助记:前者是否识别正确,后者是否本身为正
了解了混淆矩阵之后,来看看评测指标是如何定义的。
正确率Accuracy(可以看作所有样本识别正确的样本比例)
A
C
C
=
T
P
+
T
N
T
P
+
T
N
+
F
P
+
F
N
ACC=\frac{TP+TN}{TP+TN+FP+FN}
ACC=TP+TN+FP+FNTP+TN
精确率Precision(也叫作正样本预测值,是正样本在预测为正的样本中所占的比例)
表明识别为正的数据中有多少为正样本
P
r
e
c
i
s
i
o
n
=
T
P
T
P
+
F
P
Precision=\frac{TP}{TP+FP}
Precision=TP+FPTP
召回率Recall(正样本在所有预测为正的样本中的比例)
R e c a l l = T P T P + F N Recall=\frac{TP}{TP+FN} Recall=TP+FNTP
由于Precision和Recall在各自方面不能够评测整个模型的效果,所以引入了F-measure
F-measure(the harmonic mean of Precision and Recall)调和平均数
Traditional F-measure
F
=
2
∗
P
r
e
c
i
s
i
o
n
∗
R
e
c
a
l
l
P
r
e
c
i
s
i
o
n
+
R
e
c
a
l
l
F = 2 * \frac{Precision * Recall}{ Precision + Recall}
F=2∗Precision+RecallPrecision∗Recall
添加一张图方便理解
![](https://i.loli.net/2018/10/30/5bd7b68769975.png)