正确率在分类问题中最常见的指标是正确率(Accuracy),表示模型预测正确的样本比例。 正确率的定义如下:
A
c
c
u
r
a
c
y
=
T
P
+
T
N
T
N
+
F
N
+
F
P
+
F
N
Accuracy = \frac{TP + TN}{TN+FN+FP+FN}
Accuracy=TN+FN+FP+FNTP+TN
正确率指标在样本不均衡的时候不是一个很好的度量模型好坏的指标。例如在文本情绪分类数据集中,正面的样本占比为80%,负面的内容占比只有20%。如果一个分类模型将所有的样本都预测为正面,这个模型显然是一个无用的模型,但是它的正确率却可以达到80%。对于不平衡数据,精度和召回率是比正确率更好的性能评价指标。 ### 精度 精度(Precision)是指正确预测的正样本占所有预测为正样本的比例。
T P T P + F P \frac{TP}{TP+FP} TP+FPTP
召回率 召回率(Recall),又称灵敏度和命中率,是指正样本中,被正确预测的比例。
T P T P + F N \frac{TP}{TP+FN} TP+FNTP