类别不平衡问题 —— 各种评估指标

 类别不平衡问题

在二分类问题中,通常假设正负类别相对均衡(混淆矩阵),然而实际应用中类别不平衡的问题,如100, 1000, 10000倍的数据偏斜是非常常见的,比如疾病检测中未患病的人数远超患病的人数产品质量检测中合格产品数量远超不合格产品等。在检测信用卡欺诈问题中,同样正例的数目稀少,而且正例的数量会随着时间和地点的改变而不断变化分类器要想在不断变化的正负样本中达到好的检测效果是非常困难的。


由于类别不平衡问题的特性使然,一般常使用于评估分类器性能准确率错误率可能就不再适用了。因为在类别不平衡问题中我们主要关心数目少的那一类能否被正确分类,而如果分类器将所有样例都划分为数目多的那一类,就能轻松达到很高的准确率,但实际上该分类器并没有任何效果。


True Positive (真正例,TP):实际为正例,预测为正例。

False Negative (假负例,FN):实际为正例,预测为负例。

True Negative (真负例,TN):实际为负例,预测为负例。

False Positive (假正例,FP):实际为负例,预测为正例。 

                                     F1 score =

 F1 score 是一个综合指标,为Precision和Recall的调和平均 (harmonic mean),数值上一般接近于二者中的较小值

因此如果F1 score比较高的话,意味着Precision和Recall都较高。

  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值