一、精准率和召回率
在上次的分享中,我们提到了评测分类模型的意义和准确率、AUC/ROC两种评测方法。朋友们可能就会思考分类的任务多种多样,评测模型的性能只有这两种方法吗?当然还有。这次我们就一起来认识一下精准率(Precision)、召回率(Recall),以及这两个结合组成的F值。
我们还是通过混淆矩阵来表示:
图1-混淆矩阵
精准率
我们从表达式开始:
图2-精准率表达式
结合混淆矩阵和表达式来理解,首先从分母开始(TP+FP),在分类任务中的意义是预测为正类的样本数量,分子的意义是样本类别实际为正并被预测为正的数量,它们两个的比值我们称为精准率,精准率是针对预测后其中一个类别的评测表达式。
这里我们重点区分一下和精准率(Precision)准确率(Accuracy),因为这两个名词的概念很容易混乱。
图3-精准率和准确率