类别不平衡解决策略

最新推荐文章于 2021-11-04 22:33:16 发布

林夕雨小月

最新推荐文章于 2021-11-04 22:33:16 发布

阅读量559

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lmx_smile/article/details/107078610

版权

类别不平衡是指分类任务中正负样本数量悬殊的情况，通常正例较少。解决策略包括再缩放预测概率、上采样正例（如SMOTE）、下采样反例以及修改损失函数（如加权损失或Focal Loss）。这些方法旨在平衡模型训练，避免过度关注多数类。

摘要由CSDN通过智能技术生成

类别不平衡

是指分类任务中不同类别的训练样本数目差别很大的情况。

需注意的是：类别不平衡学习中通常是较小类的代价更高，否则无需特殊处理。一般情况下，正例样本较少，反例样本较多。

基本策略—-再缩放：

以线性分类器为例，使用 y=w^{T}x+b对新样本x进行分类时，事实上是用预测值与阈值比较，通常y>0.5判为正例，否则反例。y实际上表达的是正例的可能性，几率y/(1-y)则反映了正例与反例可能性之比。若阈值为0.5，表明分类器认为正反例的可能性相同，即：当正反例数目不同时，令m+表示正例，m-表示反例，则观测几率是m+/m-，因此判断规则应如下：但分类器的决策规则是按公式1进行的，所以要对预测值进行调整：

再缩放的思想简单，但实际操作却不平凡。一般是基于原始数据集进行训练学习，当用训练好的分类器预测时，将上述调整策略嵌入到决策过程中，称为<

最低0.47元/天解锁文章

林夕雨小月

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
类别不平衡解决策略

类别不平衡是指分类任务中不同类别的训练样本数目差别很大的情况。需注意的是：类别不平衡学习中通常是较小类的代价更高，否则无需特殊处理。一般情况下，正例样本较少，反例样本较多。基本策略—-再缩放：以线性分类器为例，使用y=w^{T}x+b对新样本x进行分类时，事实上是用预测值与阈值比较，通常y>0.5判为正例，否则反例。y实际上表达的是正例的可能性，几率y/(1-y)则...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。