精度和召回率

最新推荐文章于 2024-07-24 09:00:00 发布

追光少年呀

最新推荐文章于 2024-07-24 09:00:00 发布

阅读量3.8k

点赞数 4

分类专栏：机器学习文章标签：分类指标机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/aLWX_hust/article/details/86546166

版权

本文探讨了在分类任务中选择正确衡量指标的重要性，特别是针对不平衡数据集。精度和召回率作为主要指标，分别表示分类正确率和查全率。精度关注正确分类的正例比例，召回率关注所有正例被正确识别的比例。文章还讨论了精度与召回率之间的权衡，并介绍了F1分数作为综合评价方法。此外，通过混淆矩阵和ROC曲线的可视化，进一步阐述了如何评估和调整模型的性能。

摘要由CSDN通过智能技术生成

一、为分类任务选择正确的衡量指标

不平衡的分类问题：如恐怖分子检测、当疾病在公众中的发病率很低时的疾病监测等
有这么一个模型：将从美国机场起飞的所有乘客简单地标注为非恐怖分子。已知美国全年平均有 8 亿人次的乘客，并且在 2000-2017 年间共发现了 19 名恐怖分子，这个模型达到了接近完美的准确率——99.9999999%。
在恐怖分子检测的问题中宣布所有的数据点为负例（非恐怖分子）是毫无裨益的，相反，我们应该聚焦于正例（恐怖分子）的识别。
直觉告诉我们，我们应该最大化的是统计学上称为召回率或查全率（recall）的衡量指标，或者是最大化模型找到数据集中所有相关案例的能力。
精度：P = TP/(TP+FP);
反映了被分类器判定的正例中真正的正例样本的比重。
准确率（Accuracy）
A = (TP + TN)/(P+N) = (TP + TN)/(TP + FN + FP + TN);
反映了分类器统对整个样本的判定能力——能将正的判定为正，负的判定为负。
召回率(Recall && True Positive Rate)
Recall=TP/(TP+FN);
反映了所有真正为正例的样本中被分类器判定出来为正例的比例
精度就是找得对，召回率就是找得全。
精度（查准率）不冤枉一个好人
召回率（查全率）不放过一个坏人
大概就是你问问一个模型

最低0.47元/天解锁文章

追光少年呀

关注

4
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。