机器学习的模型性能度量：评估指标PR对比ROC/AUC

最新推荐文章于 2024-04-16 13:57:57 发布

迷路的咸鱼

最新推荐文章于 2024-04-16 13:57:57 发布

阅读量2.9k

点赞数 1

分类专栏：机器学习系列文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_37002417/article/details/108476755

版权

一般，对学习器的泛化性能进行评估，需要有能衡量模型泛化性能的评价标准，即性能度量（performance measure）。性能度量反映了任务需求，在对比不同模型的能力时，使用不同的性能度量往往会导致不同的评判结果，并通过这个指标来进一步调参逐步优化我们的模型。下面是一个机器学习小白的学习记录。

分类常用的性能度量

混淆矩阵
精准率和召回率
- P-R曲线
- F-score
ROC/AUC
- KS(Kolmogorov-Smirnov)值
P-R曲线和ROC曲线的对比

混淆矩阵

对于二分类的模型，可以把预测情况与实际情况的所有结果两两组合，结果就会出现以下4种情况，就组成了分类结果的混淆矩阵（confusion matrix）：

令TP、FP、TN、FN分别表示其对应的样例数，则显然有TP+FP+TN+FN=样例总数。分类的准确率可以表示为预测正确的结果占总样本的百分比，其公式如下：
$准确率=\frac{TP+TN}{TP+TN+FP+FN}$

由于样本不平衡的问题，导致即使得到较高的准确率结果，并不能作为很好的指标来衡量结果。举个简单的例子，比如在一个总样本中，正样本占90%，负样本占10%，样本是严重不平衡的，对于这种情况，即使全部样本预测为正样本即可得到90%的高准确率。因此说明如果样本不平衡，准确率就会失效。

精准率和召回率

精准率（Precision）又叫查准率，它是针对预测结果而言的，它的含义是在所有被预测为正的样本中实际为正的样本的概率。意思就是，在预测为正样本的结果中，我们有多少把握可以预测正确，其公式如下：
$精准率=\frac{TP}{TP+FP}$

最低0.47元/天解锁文章

迷路的咸鱼

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
机器学习的模型性能度量：评估指标PR对比ROC/AUC

一般，对学习器的泛化性能进行评估，需要有能衡量模型泛化性能的评价标准，即性能度量（performance measure）。性能度量反映了任务需求，在对比不同模型的能力时，使用不同的性能度量往往会导致不同的评判结果，并通过这个指标来进一步调参逐步优化我们的模型。分类常用的性能度量混淆矩阵精准率和召回率ROC/AUC混淆矩阵对于二分类的模型，可以把预测情况与实际情况的所有结果两两组合，结果就会出现以下4种情况，就组成了分类结果的混淆矩阵（confusion matrix）：令TP、FP
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。