机器学习/数据处理领域结果的评估度量——召回率、精度、F1score等指标计算方法

本文介绍了在数据挖掘和不平衡类问题中,如何使用召回率、精度和F1score作为评估指标。召回率关注正确识别正类的能力,精度衡量分类器预测正类的准确性,而F1score则是召回率和精度的调和平均值,用于综合考虑两者。在某些场景下,如疾病检测,高召回率更为关键,即使牺牲一定的精度。
摘要由CSDN通过智能技术生成

我们常常在一些论文后看到作者给出的一些评估度量,不仅仅是简单的正确率,还有Fscore、recall等看似高深的东西。那么这些东西是怎么来、怎么用的呢?

我们要从不平衡类问题讲起。因为在正、负样本不均衡的类中,如果单一使用准确率可能是很不合理的。比如有10个异常类(一般标为正类),90个正常类(负类),那么我们关心的是异常类能不能都被正确分出来,这样才能达到我们的目标效果(就是检测异常)。如果我们训练的分类器把所有类都输出为负类,分类器的准确率也有90%,但对我们的目标而言没什么软用,所以稀有类的正确分类更重要。我们需要为这种不平衡问题设计合理的评估度量。

我们汇总分类模型正确和不正确预测的实例数目的混淆矩阵:

其中术语:

混淆矩阵中的计数可以表示为百分比形式。

真正

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值