【术语扫盲】评估指标Precision、Recall、F1-score、Support是什么含义?

一、背景

Precision、Recall、F1-score、Support 是分类问题中最常用的评估指标,它们是机器学习、深度学习、数据挖掘中非常基础也非常重要的术语。

二、 详细解释

指标含义公式
Precision(精准率)预测为某类的样本中,有多少是真的属于这个类的。TP / (TP + FP)
Recall(召回率)实际属于某类的样本中,有多少被你成功找出来了。TP / (TP + FN)
F1-score精准率和召回率的调和平均值,是它们之间的平衡。2 × (P × R) / (P + R)
Support每个类别在测试集中实际有多少个样本。——

TP(True Positive):预测对了,是真的。

FP(False Positive):预测错了,把不是的当成是的。

FN(False Negative):漏掉了,是真的没发现。

三、 大白话解释

我们用一个常见的例子:抓“小偷”,你是警察,模型是你抓人的直觉!

1、Precision(精准率): 抓到的人里,真的小偷占比多高

就是你抓的那些人,到底有多少小偷?

比如你抓了10个人,其中8个真的是小偷,那精准率就是 8 / 10 = 80%。

通俗说法:

“别乱抓路人啊,抓一个就得抓准了,别给自己找麻烦!”

2、Recall(召回率)= 所有小偷里,你抓住了多少

就是街上真的有小偷,你到底抓住了几个?

比如街上本来有100个小偷,你只抓到了20个,召回率就是 20 / 100 = 20%。

📢 通俗说法:

“你不能光会喊口号,小偷都跑了你才发现,叫啥警察?”

⚖️ F1-score = 平衡精准率和召回率的综合表现
有时候你精准率高(不冤枉好人),但漏抓很多;
有时召回率高(啥都抓),但冤枉一堆。

3、F1-score

“你要又抓得准、又不漏人,不能偏科!”

“既不能眼瞎乱抓人,也不能装瞎看不见人。”

4、 Support = 真正小偷和好人有多少

就是告诉你现场到底有多少个小偷、多少个好人,好评估表现。

“你一天只抓到1个小偷,那表现再好也没啥说服力啊;你抓了成千上万,那才是真本事!”

四、 应用场景

1、医疗诊断(癌症检测)

背景:识别一个病人是否患癌

Precision(精准率):预测为癌症的人中,有多少是真的癌症(误诊少)

Recall(召回率):所有癌症患者中,有多少被识别出来(漏诊少)

F1-score:精准率和召回率的平衡

Support:测试集里到底有多少癌症和非癌症患者

🧠 重点:宁愿多查一点假阳性(Precision 低一点),也不要漏掉真正的患者(Recall 要高)

2、金融风控(信用卡欺诈识别、逾期预测)

背景:识别用户是否会“逾期”或“刷爆卡跑路”

Precision:你说“会逾期”的用户里,实际逾期的比例(别误伤太多人)

Recall:所有真的会逾期的人中,识别出了多少(尽量别漏)

F1-score:金融机构希望兼顾风险与用户体验

Support:测试数据里,逾期与不逾期的人数比例往往严重不均衡

💰 重点:逾期是小概率事件,要想方设法提高对少数类的识别率(Recall)

3、垃圾邮件识别(文本分类)

背景:模型判断邮件是不是垃圾

Precision:预测为垃圾邮件的那些,有多少是真垃圾?(别冤枉正常邮件)

Recall:所有垃圾邮件中,被你识别出来的有多少?

F1-score:既不放过垃圾,也不误杀正常

Support:有多少垃圾邮件、多少正常邮件

📧 重点:精准率低,会让用户错过重要邮件;召回率低,会让垃圾邮件漏掉

4、人脸识别 / 安防监控

背景:识别“嫌疑人”是否出现在监控画面中

Precision:你报警的画面里,有多少是真的嫌疑人?(误报多会打扰警察)

Recall:真的嫌疑人出现了,你识别出来没?(漏报后果更严重)

F1-score:找平衡,既不乱报警也不漏掉坏人

Support:嫌疑人出现多少次 vs 正常人出现多少次

👮 重点:不同场景下要选择不同优先级,有的地方“宁可错杀一千”,有的地方则“错杀一个都不行”

五、总结:

Precision、Recall、F1-score 这三兄弟,是在分类模型中判断表现优不优的“法官”。
它们的组合帮助我们在各种场景下“少冤枉、少漏人、又聪明”。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值