在运用机器学习或深度学习进行数据分类时,通常会用一些性能的指标来度量分类的效果。在这里我们介绍最常用的几种分类的性能度量指标(准确率、精确度、召回率、F1值、Kappa系数)。
对于二分类问题,我们的原始数据是被分为两类的(设他们分别是正、反类或0、1类),而在经过分类器分类之后,每一个数据样本都会被分类器认定为某一类(正(positive)或反(negative)),这也就是分类结果,最终判断其分类结果正确与否(true和false)。所以我们有一些符号设定:
把原数据集中为正类,分类后仍为正类的样本集合记为TP(true positive);
把原数据集中为正类,但分类后为反类的样本集合记为FN(false negative);
把原数据集中为反类,但分类后为正类的样本集合记为FP(false positive);
把原数据集中为反类,分类后仍为反类的样本集合记为TN(true negative);
如下表可以发现:T和F代表最终的分类结果是否正确;P和N代表分类的结果是正类或反类。
接下来,我们根据上面的基础总结几个分类性能评估指标:
准确率(accuracy)
准确即正确的,