目录
前言
准确度、精确率、召回率、F1值作为评估指标,经常用到分类效果的评测上。比较好理解的二分类问题,准确度评估预测正确的比例,精确率评估预测正例的查准率,召回率评估真实正例的查全率。如何把这些评估指标用到多分类上呢,比如有三个类别A、B、C,准确度好理解,只要关系是否预测正确即可;那么精确率和召回率怎么理解呢?我们可以把多分类问题拆分成多个二分类问题,比如A类别是否预测正确,B类别是否预测正确,C类别是否预测正确,分别计算各个类别的每个类别的精确率和召回率,最终求均值既能作为所有样本的评估指标。
基本概念
TP(True Positives):真正例,预测为正例而且实际上也是负例;
FP(False Positives):假正例,预测为正例然而实际上却是负例;
FN(false Negatives):假负例,预测为负例然而实际上却是正例;
TN(True Negatives):真负例,预测为负例而且实际上也是负例。
记忆要点:正负例的是依据预测值,真假是依据实际值。真正例的意思,预测为正例,实际上是真的正例。
用二分类的问题类举例,有黑白色球,真实的球个数是黑球3个,白球7个,编号和真实颜色如下表格:
模型预测结果为黑球4个,白球6个,预测结果入下表格,红色代表预测正确:
如果我们以黑球为正例标准,则可以统计出:
TP:2个, 预测是黑色的,实际就是黑色的,即黑字红色部分。
FP:2个,预测是黑色的,实际是白色的,即黑字黑色部分,即编号4和5。
FN:1个,预测是白色的,实际是黑色的&#x