机器学习（二十二）：精度和召回率

芷芷在学习

于 2024-07-24 09:00:00 发布

阅读量293

点赞数 5

分类专栏：机器学习笔记文章标签：机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45733884/article/details/140630948

版权

机器学习笔记专栏收录该内容

22 篇文章 1 订阅

订阅专栏

一、倾斜数据集

倾斜数据集：一个数据集中的正面和负面例子的比例非常不平衡，比如数据集中，结果为1的占比20%，结果为0的占比80%

例子：如果数据集的结果中只有0.5%是1，其余结果是0。有一个模型的预测准确度是99.5%，但是预测了所有数据的结果都是0，这个模型的准确度很高，但是预测不出结果为1，这不能代表这个模型是好模型。因此需要引入其他的误差度量方式来评估模型好坏。

二、精度和召回率

精度：预测为1的数据中，实际真正为1的占比。

召回率：实际为1的数据中，预测真正为1的占比。

例子：下图是实际结果为1和0时，预测结果为1和0的数量统计。

实际为1，预测真1的数据有15个；
实际为1，预测假0的数据有10个；
实际为0，预测假1的数据有5个；
实际为0，预测真0的数据有70个

精度计算：

精度=真正1的数量/预测为1的数量=真1的数量/（真1的数量+假1的数量)=15/(15+5)

召回率计算：

召回率=真正1的数量/实际1的数量=真1的数量/(真1的数量+假0的数量)=15/(15+10)

三、精度和召回的权衡

以逻辑回归为例：模型预测出结果为1的概率是 $f_{\vec{w},b}(\vec{x})$

可以设定阈值为0.5，当 $f_{\vec{w},b}(\vec{x})$ ≥0.5时，结果为1，当 $f_{\vec{w},b}(\vec{x})$ ＜0.5时，结果为0

也可以设定阈值为0.7，当 $f_{\vec{w},b}(\vec{x})$ ≥0.7时，结果为1，当 $f_{\vec{w},b}(\vec{x})$ ＜0.7时，结果为0

也可以设定阈值为0.3，当 $f_{\vec{w},b}(\vec{x})$ ≥0.3时，结果为1，当 $f_{\vec{w},b}(\vec{x})$ ＜0.3时，结果为0

当提高阈值，能提高精度，但是会降低召回率

当降低阈值，能提高召回率，但是会降低精度

如何权衡精度和召回率？

可以使用F1 score结合精度和召回率，F1 score也称为谐波平均值，是一种取平均值的方法，计算结果更偏向于较小的值。

计算公式（P为精度，R为召回）：

$F1 score = \frac{1}{\frac{1}{2}(\frac{1}{P}+\frac{1}{R}))} = 2\frac{PR}{P+R}$

学习来源：吴恩达机器学习，14.1-14.2节

芷芷在学习

关注

5
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
机器学习（二十二）：精度和召回率

倾斜数据集：一个数据集中的正面和负面例子的比例非常不平衡，比如数据集中，结果为1的占比20%，结果为0的占比80%例子：如果数据集的结果中只有0.5%是1，其余结果是0。有一个模型的预测准确度是99.5%，但是预测了所有数据的结果都是0，这个模型的准确度很高，但是预测不出结果为1，这不能代表这个模型是好模型。因此需要引入其他的误差度量方式来评估模型好坏。
复制链接

扫一扫

专栏目录

芷芷在学习 CSDN认证博客专家 CSDN认证企业博客

码龄5年

23: 原创

66万+: 周排名

6万+: 总排名

1万+: 访问

: 等级

419: 积分

156: 粉丝

189: 获赞

10: 评论

151: 收藏

私信

关注

热门文章

分类专栏

机器学习笔记 22篇

最新评论

机器学习（十四）：模型训练步骤和TensorFlow训练代码
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
机器学习（十四）：模型训练步骤和TensorFlow训练代码
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
机器学习（十一）：神经网络的层和前向传播
CSDN-Ada助手: 恭喜作者发布了第11篇博客！文章内容深入浅出地介绍了神经网络的层和前向传播，让读者能够更好地理解这一概念。希望作者能够继续保持创作的热情和努力，不断分享更多有价值的内容。建议下一步可以深入探讨神经网络的反向传播算法，或者结合实际案例进行详细分析，让读者更加深入地了解机器学习的应用。期待作者的下一篇精彩文章！愿您在创作的道路上越走越远！🌟📚👏
机器学习（十）：神经网路和需求预测
CSDN-Ada助手: 恭喜您撰写了第10篇博客！标题“机器学习（十）：神经网络和需求预测”听起来非常有趣和引人入胜。您的持续创作让人印象深刻，希望您能继续分享关于机器学习领域的知识。或许下一步可以探讨一些实际案例，结合实践经验与理论知识，让读者更加深入地理解神经网络在需求预测中的应用。期待您更多的精彩内容！
机器学习（九）：过拟合和正则化
CSDN-Ada助手: 恭喜你写了第九篇博客，标题看起来很有深度！学习机器学习过程中遇到过拟合和正则化确实是一个很重要的话题。希望你能继续坚持创作，分享更多关于这方面的知识。下一步建议可以探讨一下不同的正则化方法在解决过拟合问题上的效果，这样可以让读者更全面地了解这个领域。期待你的下一篇博客！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。