二分类评价指标——混淆矩阵![](https://img-blog.csdnimg.cn/2021091510092684.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBAd2VpeGluXzU0MDk2MjE1,size_19,color_FFFFFF,t_70,g_se,x_16)
上表为混淆矩阵,行表示预测的label值,列表示真实label值。TP指的是样本真实类别为正,预测类别为正,FP指的是样本真实类别为负,预测类别为正,FN指的是样本真实类别为正,预测类别为负,TN指的是样本真实类别为负,预测类别为负。
TP和TN是预测正确的样本数,FP和FN是预测错误的样本数。
1.1 准确率Accruacy
缺点: 如果负样本预测都为正确的,则这个评价指标显然是比较差的。
1.2 精确率Precision和召回率Recall
精确率:预测结果中,预测为正样本的样本中,正确预测为正样本的概率;
召回率:在原始样本的正样本中,最后被正确预测为正样本的概率;
设定一个阈值,阈值之上是正样本,之下是负样本。但是当阈值很高时,预测为正样本的是分类器中最有把握的一批样本,此时精确率高但是召回率很低。阈值很低时,把一些分类器拿不准的样本也预测为正样本,则召回率高,精确率低。
1.3 F1-score
1.4 ROC与AUC
AUC定义为ROC曲线下方的面积:
两个指标
假阳率:预测为正样本但是预测错了的可能性,越低越好
真阳率:预测为正样本但是预测对了的可能性,越高越好
横轴是FPR,纵轴是TPR