机器学习：评价指标：分类问题、回归问题、排序问题

最新推荐文章于 2024-06-25 20:25:00 发布

work_coder

最新推荐文章于 2024-06-25 20:25:00 发布

阅读量1.7w

点赞数 5

分类专栏：机器学习概要深度学习概要

本文链接：https://blog.csdn.net/weixin_41108334/article/details/84502204

版权

本文详细介绍了机器学习中分类、回归和排序问题的评价指标。对于分类问题，讨论了混淆矩阵、准确率、平均准确率、精确率、召回率、F1 Score以及ROC曲线和AUC的概念和计算。特别强调了AUC在处理正负样本分布变化时的稳定性。回归问题中，提到了SSE、MSE、RMSE、MAE和R-Squared等指标，以及它们在衡量模型性能中的作用。此外，还探讨了不同评价指标的优缺点和应用场景。

摘要由CSDN通过智能技术生成

参考：链接：https://www.jianshu.com/p/4dde15a56d44

https://blog.csdn.net/heyongluoyao8/article/details/49408319

评价指标(Evaluation metrics)

评价指标是机器学习任务中非常重要的一环。不同的机器学习任务有着不同的评价指标，同时同一种机器学习任务也有着不同的评价指标，每个指标的着重点不一样。如分类（classification）、回归（regression）、排序（ranking）、聚类（clustering）、热门主题模型（topic modeling）、推荐（recommendation）等。并且很多指标可以对多种不同的机器学习模型进行评价，如精确率－召回率（precision-recall），可以用在分类、推荐、排序等中。像分类、回归、排序都是监督式机器学习，本文的重点便是监督式机器学习的一些评价指标

一、从二分类评估指标说起

1.1 混淆矩阵confusion_matrix

我们首先来看一下混淆矩阵，对于二分类问题，真实的样本标签有两类，我们学习器预测的类别有两类，那么根据二者的类别组合可以划分为四组，如下表所示：

上表即为混淆矩阵，其中，行表示预测的label值，列表示真实label值。TP，FP，FN，TN分别表示如下意思：

TP（true positive）：表示样本的真实类别为正，最后预测得到的结果也为正；
FP（false positive）：表示样本的真实类别为负，最后预测得到的结果却为正；
FN（false negative）：表示样本的真实类别为正，最后预测得到的结果却为负；
TN（true negative）：表示样本的真实类别为负，最后预测得到的结果也为负.

可以看到，TP和TN是我们预测准确的样本，而FP和FN为我们预测错误的样本。

sklearn.metrics.confusion_matrix(y_true, y_pred, labels=None, sample_weight=None)

coding :

y_true: 是样本真实分类结果，y_pred: 是样本预测分类结果
labels：是所给出的类别，通过这个可对类别进行选择
sample_weight : 样本权重

1.2 准确率Accruacy

准确率表示的是分类正确的样本数占样本总数的比例，假设我们预测了10条样本，有8条的预测正确，那么准确率即为80%。

用混淆矩阵计算的话，准确率可以表示为：

虽然准确率可以在一定程度上评价我们的分类器的性能，不过对于二分类问题或者说CTR预估问题，样本是极其不平衡的。对于大数据集来说，标签为1的正样本数据往往不足10%，那么如果分类器将所有样本判别为负样本，那么仍然可以达到90%以上的分类准确率，但这个分类器的性能显然是非常差的。

1.3 平均准确率(Average Per-class Accuracy)

为了应对每个类别下样本的个数不一样的情况，对准确率进行变种，计算每个类别下的准确率，然后再计算它们的平均值。举例，类别0的准确率为80%，类别1下的准确率为97.5%，那么平均准确率为(80%+97.5%)/2=88.75%。因为每个类别下类别的样本个数不一样，即计算每个类别的准确率时，分母不一样，则平均准确率不等于准确率，如果每个类别下的样本个数一样，则平均准确率与准确率相等。
平均准确率也有自己的缺点，比如，如果存在某个类别，类别的样本个数很少，那么使用测试集进行测试时（如k-fold cross validation），可能造成该类别准确率的方差过大，意味着该类别的准确率可靠性不强。

1.4 精确率Precision和召回率Recall

为了衡量分类器对正样本的预测能力，我们引入了精确率Precision和召回率Recall。

精确率表示预测结果中，预测为正样本的样本中，正确预测为正样本的概率；
召回率表示在原始样本的正样本中，最后被正确预测为正样本的概率；<

最低0.47元/天解锁文章

work_coder

关注

5
点赞
踩
68

收藏

觉得还不错? 一键收藏
0
评论
机器学习：评价指标：分类问题、回归问题、排序问题

参考：链接：https://www.jianshu.com/p/4dde15a56d44https://blog.csdn.net/heyongluoyao8/article/details/49408319评价指标(Evaluation metrics) 评价指标是机器学习任务中非常重要的一环。不同的机器学习任务有着不同的评价指标，同时同一种机器学习任务也有着不同的评价指标，每个指...
复制链接

扫一扫

专栏目录