分类任务算法的性能度量

本文详细介绍了分类任务的性能度量,包括准确率、精确率、召回率及其关系,重点讲解了P-R曲线、ROC曲线的绘制原理和AUC的计算。强调在样本不平衡时,ROC和PR曲线的重要性,尤其是PR曲线在正负样本分布极不均匀情况下的优势。
摘要由CSDN通过智能技术生成

一.准确率 - accuracy

这个好理解,就是分类正确的样本数占样本总数的比例,但在二分类且正反例不平衡的情况下,这个基本没有参考价值,举个栗子:
在测试集里,有100个sample,99个反例,只有1个正例。如果我的模型不分青红皂白对任意一个sample都预测是反例,那么我的模型的accuracy是 正确的个数/总个数 = 99/100 = 99%,你拿着这个accuracy高达99%的模型屁颠儿屁颠儿的去预测新sample了,而它一个正例都分不出来,有意思么。。。

二.精确率 - precision和召回率 - recall

这里写图片描述
精确率P=TP/(TP+FP) 表示在预测结果为正例的样本中,有多少是真正的正例。
召回率R=TP/(TP+FN) 表示在所有真正为正例的样本中,有多少被预测出来。
精确率和召回率是一对相对矛盾的度量!
F1值是精确率和召回率的调和均值,即F1=2PR/(P+R),相当于精确率和召回率的综合评价指标。
另外还有Fα值,为F1值的变体, Fα=(α^2+1)PR/(α^2 P+R) ,利用α给P和R赋予不同的权重,若α=1则为F1值。α>1时精确率有更大影响;α<1时召回率有更大影响。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值