信噪比的角度理解机器学习里的 Precision 和 Recall

歪, 110嘛?

于 2024-01-21 22:16:38 发布

阅读量415

点赞数 8

文章标签：机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_40470384/article/details/135734807

版权

分类任务可以比喻成新冠的检测，要把阳性检出。
如何量化这个检出能力？
考虑多少阳性被检出，尽量减少漏网之鱼。

即：检出的阳性/样本里的全部阳性。

注意：预测里的假阴，就是样本里的阳

因此全部阳性=假阴性（Fasle negative）+真阳性（positive negative），因此等于真阳/（假阴性+真阳性），用 “Recall” 评估。

“Recall” 这个词儿指的是从既有信息中，回忆、检索到目标意思，这种 “检出率” 严格地说是样本中的检出率，并不能代表真实，因此用 recall 最合适不过，语义上非常严格地限定了 “不做预测” 的特性。

考虑这样的模型给出的信号时，“噪声” 便是不小心被**“放过”的那一部分，而另一种噪声是“杀错”**，比如杀毒任务、垃圾邮件拦截任务中被误杀的良文件。这一部分，即精准度（Precision），P=真阳/预测为阳的量。

但无论如何，信号都是被正确圈出来的那部分真阳性。

既然是噪声，那如何合成总体我们要的呢？统计上使用调和平均数去考虑P和R，得到F1值。

最后，给出 gpt 从交叉熵角度的讨论：

信息增益（Information Gain）和交叉熵（Cross-Entropy）：

信息增益衡量的是在知道某个特征或预测结果后不确定性减少的量
在优化模型时，我们希望最大化关于目标变量的信息增益。（也就是说，我们希望优化的模型，是一个给的结果能减少不确定度的，而不是因为效果不好所以得复检）。

交叉熵是衡量两个概率分布之间差异的一种方式。
在分类任务中，交叉熵损失可以衡量模型预测的概率分布与实际标签的概率分布之间的差异
在这个视角下，减少“漏检”和“误报”可以被视为减少模型预测和真实分布之间的交叉熵。
（训练时不光比较结果，还比较给出的概率分布。）

在这里插入图片描述

关注

8
点赞
踩
8

收藏

觉得还不错? 一键收藏
1
评论
信噪比的角度理解机器学习里的 Precision 和 Recall

Recall” 这个词儿指的是从既有信息中，回忆、检索到目标意思，这种 “检出率” 严格地说是样本中的检出率，并不能代表真实，因此用 recall 最合适不过，语义上非常严格地限定了 “不做预测” 的特性。（也就是说，我们希望优化的模型，是一个给的结果能减少不确定度的，而不是因为效果不好所以得复检）。在这个视角下，减少“漏检”和“误报”可以被视为减少模型预测和真实分布之间的交叉熵。在分类任务中，交叉熵损失可以衡量模型预测的概率分布与实际标签的概率分布之间的差异。注意：预测里的假阴，就是样本里的阳。
复制链接

扫一扫

歪, 110嘛?

CSDN认证博客专家 CSDN认证企业博客

码龄7年

10: 原创

29万+: 周排名

13万+: 总排名

6147: 访问

: 等级

139: 积分

23: 粉丝

34: 获赞

5: 评论

24: 收藏

私信

关注

热门文章

分类专栏

绿茶学代码 3篇

最新评论

python 装饰器如何理解不费劲？
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
如何快速区分TCP五层协议的每一层
CSDN-Ada助手: 恭喜你写了这么有用的一篇博客！快速区分TCP五层协议的每一层对于初学者来说确实是一个挑战，你的文章给了很多实用的建议。希望你能继续分享关于网络协议的知识，或者可以写一些实际案例分析，让读者更好地理解和运用这些知识。期待你的下一篇作品！
信噪比的角度理解机器学习里的 Precision 和 Recall
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
虚拟环境设置代理的技术
CSDN-Ada助手: 恭喜您写了第7篇博客！标题为“虚拟环境设置代理的技术”，您的文章内容非常有价值，对于那些需要在虚拟环境下设置代理的人来说，这篇博客无疑将提供了宝贵的指导。您深入浅出地介绍了技术细节，使读者能够轻松理解并应用这些技术。鉴于您在虚拟环境方面的深入研究，我建议您在未来的创作中，可以进一步探索如何在不同操作系统和开发环境中设置代理，或者分享一些实践经验和解决问题的技巧。这样的话，读者将更加深入地了解代理设置的全貌，并能够更好地应对各种挑战。希望我的建议对您有所帮助，期待您在未来的博客中继续分享您的知识与见解！再次恭喜您，并感谢您为我们带来如此有用的内容。
【pytest Debug】vscode 里让你按下F5就能执行 pytest并断点
CSDN-Ada助手: 恭喜你写了这么有用的博客！让我们可以在 VS Code 里更方便地执行 pytest 并进行调试，真的是太棒了。作为下一步的创作建议，我建议你可以探索更多关于 pytest 的使用技巧和实践经验，分享给更多的读者。再次感谢你的分享，期待你的下一篇博客！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply6 看奖励名单。

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。