对于二分类问题,根据真实结果和预测结果得到“混淆矩阵”,其结果组合可分为真正例(true positive)、假正例(false positive)、真反例(true negative)、假反例(false negative)四种情况,其简写分别为TP、FP、TN、FN。
查准率P(precision)和查全率R(recall)是对预测性能的度量。
P
=
T
P
T
P
+
F
P
P=\frac{TP}{TP+FP}
P=TP+FPTP
R
=
T
P
T
P
+
F
N
R=\frac{TP}{TP+FN}
R=TP+FNTP
P和R是一对矛盾的度量,不会同时很高或很低。
查准率P比较容易理解,是计算在所有预测为正例的结果中,真正为正例的比例。以风控为例,可以设有风险的为正例,无风险的为反例,则查准率就是度量有风险的被预测出的准确率。
查全率R我一直不能很好理解,今天听到一个说法比较好懂,在这里分享一下。在周志华老师的《机器学习》里,recall被翻译成查准率,直译recall可以为召回率,可能比较好理解。召回率可以理解为能够“抢救回来”的比例。依旧用风控的例子,召回率就是能够确定有风险(从而将其召回)占全部真正有风险的比例,TP是被预测为风险并且能够召回的。从召回的概念再去理解查全率,我就比较明白了。