类别不平衡解决策略

类别不平衡是指分类任务中正负样本数量悬殊的情况,通常正例较少。解决策略包括再缩放预测概率、上采样正例(如SMOTE)、下采样反例以及修改损失函数(如加权损失或Focal Loss)。这些方法旨在平衡模型训练,避免过度关注多数类。
摘要由CSDN通过智能技术生成

类别不平衡

是指分类任务中不同类别的训练样本数目差别很大的情况。

需注意的是:类别不平衡学习中通常是较小类的代价更高,否则无需特殊处理。一般情况下,正例样本较少,反例样本较多。

基本策略—-再缩放

以线性分类器为例,使用 y=w^{T}x+b对新样本x进行分类时,事实上是用预测值与阈值比较,通常y>0.5判为正例,否则反例。y实际上表达的是正例的可能性,几率y/(1-y)则反映了正例与反例可能性之比。若阈值为0.5,表明分类器认为正反例的可能性相同,即: 当正反例数目不同时,令m+表示正例,m-表示反例,则观测几率是m+/m-,因此判断规则应如下: 但分类器的决策规则是按公式1进行的,所以要对预测值进行调整:

再缩放的思想简单,但实际操作却不平凡。一般是基于原始数据集进行训练学习,当用训练好的分类器预测时,将上述调整策略嵌入到决策过程中,称为<

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值