召回率和准确率理解

最新推荐文章于 2025-03-24 18:38:10 发布

小泽爱刷题

最新推荐文章于 2025-03-24 18:38:10 发布

阅读量2.5k

点赞数 5

文章标签：机器学习人工智能

本文链接：https://blog.csdn.net/m0_48938554/article/details/141857854

版权

召回率（Recall）和准确率（Precision）是评估分类模型或配准算法性能的重要指标，它们的具体意义和区别如下：

定义：召回率衡量的是实际为正类的样本中被正确识别为正类的比例。
公式：

$(FN)\text{Recall} = \frac{\text{True Positives (TP)}}{\text{True Positives (TP)} + \text{False Negatives (FN)}}Recall=True Positives (TP)+False Negatives (FN)True Positives (TP)$
- True Positives (TP)：被正确识别为正类的样本数。
- False Negatives (FN)：实际为正类但被误识别为负类的样本数。
意义：召回率反映的是模型找到所有正类样本的能力。高召回率意味着模型尽可能多地识别出了正类样本，即使这可能会导致更多的误报（False Positives）。

定义：准确率衡量的是被预测为正类的样本中实际为正类的比例。
公式：

$(FP)\text{Precision} = \frac{\text{True Positives (TP)}}{\text{True Positives (TP)} + \text{False Positives (FP)}}Precision=True Positives (TP)+False Positives (FP)True Positives (TP)$
- True Positives (TP)：被正确识别为正类的样本数。
- False Positives (FP)：实际为负类但被误识别为正类的样本数。
意义：准确率反映的是模型预测为正类时的可靠性。高准确率意味着大部分被识别为正类的样本确实是正类，从而减少误报。

权衡：召回率和准确率往往呈现反向关系。在某些情况下，增加召回率可能会降低准确率，反之亦然。例如：
- 高召回率：为了捕捉所有的正类，模型可能会容忍更多的误报，这会降低准确率。
- 高准确率：为了确保每一个预测为正类的样本都是正确的，模型可能会忽略一些真正的正类样本，从而降低召回率。
使用场景：
- 召回率优先：在关注找到所有正类样本的场景中，如疾病筛查或安全检测中，更高的召回率至关重要，即使这意味着更多的误报。
- 准确率优先：在误报代价较高的场景中，如电子邮件过滤中的垃圾邮件分类，更高的准确率可能更为重要。

实际通俗解释

场景：你有一个垃圾邮件过滤器，它要识别哪些邮件是垃圾邮件，哪些是正常邮件。

召回率：如果过滤器有很高的召回率，它几乎把所有的垃圾邮件都识别出来了，但可能有时候会误把一些正常的邮件也当作垃圾邮件。
- 实际意义：这意味着你几乎不会被垃圾邮件打扰，但有时正常邮件可能会被漏掉到垃圾箱。
准确率：如果过滤器有很高的准确率，它只把那些真正的垃圾邮件识别出来，而不会误删正常邮件。
- 实际意义：这意味着你几乎不会错过任何重要邮件，但可能有一些垃圾邮件会漏掉到你的收件箱。

场景：一个医生在使用一种测试来检测某种疾病。

召回率：高召回率的测试会确保几乎所有患有这种疾病的人都能被检测出来，即使有些健康的人可能会被误诊为患病。
- 实际意义：如果你使用这种测试，几乎所有的患者都能被及时发现并治疗，但有些健康的人可能会被吓到，需要进一步的检查来确认。
准确率：高准确率的测试则意味着一旦检测出有问题，几乎可以肯定这个人真的患有这种疾病，但也可能会漏掉一些真正的病人。
- 实际意义：这种测试很可靠，但可能会错过一些早期或症状不明显的病例，导致患者得不到及时的治疗。

假设你是一个警察，在寻找嫌疑犯。

现在假设你还是那个警察，但你希望只抓真正的罪犯。

召回率优先：如果你要去商店买东西，但你不知道自己可能忘了什么。你可能会把所有可能需要的东西都买回来，以确保不落下任何东西——即使你买了一些其实不需要的东西。
准确率优先：如果你非常有预算意识，只想买你肯定需要的东西，那么你只会买那些确定会用到的，避免任何多余的开支——即使你可能会遗漏一些需要的东西。

总结来说，召回率关注的是“抓到更多”，而准确率关注的是“抓得准”。召回率尽量把所有符合要求的都拿下准确率关注抓得准，可以会遗漏一些符合要求的