分类结果评价指标

最新推荐文章于 2022-11-20 14:27:07 发布

jaeden_xu

最新推荐文章于 2022-11-20 14:27:07 发布

阅读量640

点赞数

分类专栏：数据分析挖掘文章标签：机器学习概率论

本文链接：https://blog.csdn.net/qq_41807261/article/details/120563370

版权

数据分析挖掘专栏收录该内容

58 篇文章 36 订阅

订阅专栏

混淆矩阵
在二分类的模型中，混淆矩阵把预测情况与实际情况的所有结果进行组合，形成了真正 (true positive)、假正 (false positive)、真负 (true negative) 和假负 (false negative) 四种情形，分别由TP、FP、TN、FN 表示（T代表预测正确，F代表预测错误）。

from sklearn.metrics import confusion_matrix
y_true = [2, 0, 2, 2, 0, 1]
y_pred = [0, 0, 2, 2, 0, 2]
confusion_matrix(y_true, y_pred)

准确率
准确率的定义是预测正确的结果占总样本的百分比，其公式如下：
准确率=(TP+TN)/(TP+TN+FP+FN)
精确率
精准率（Precision）又叫查准率，它是针对预测结果而言的，它的含义是在所有被预测为正的样本中实际为正的样本的概率，意思就是在预测为正样本的结果中，我们有多少把握可以预测正确，其公式如下：
精准率=TP/(TP+FP)
召回率
召回率（Recall）又叫查全率，它是针对原样本而言的，它的含义是在实际为正的样本中被预测为正样本的概率，其公式如下：
召回率=TP/(TP+FN)
F1 Score
F1 score是分类问题的一个衡量指标，一些多分类问题的机器学习竞赛，常把F1 score作为最终评测的方法。它是精确率和召回率的调和平均数，取值0-1之间。
F1 score认为召回率和精确率同样重要，而F2认为召回率的重要程度是精确率的2倍，F0.5则认为召回率的重要程度是精确率的一半。
P-R曲线
P-R曲线，就是查准率(precision)与查全率(recall)的曲线，以查准率作为纵轴，以查全率作为横轴，其中查准率也称为准确率，查全率称为召回率
ROC
ROC曲线与P-R曲线很类似，我们根据学习器的预测结果对样例进行排序，按此顺序逐个把样本作为正例进行预测，每次计算其横纵坐标的值，就可以得到ROC曲线，但是与P-R曲线的不同是，ROC曲线横轴使用的是“假正例率”，纵轴使用的是“真正例率”
AUC
AUC（Area under curve）是机器学习常用的二分类评测手段，直接含义是ROC曲线下的面积