对类别不平衡问题的解决方法

最新推荐文章于 2023-10-20 14:50:30 发布

loveitlovelife

最新推荐文章于 2023-10-20 14:50:30 发布

阅读量1.4k

点赞数

分类专栏：机器学习相关

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/loveitlovelife/article/details/78998305

版权

机器学习相关专栏收录该内容

18 篇文章 4 订阅

订阅专栏

基本概念

类别不平衡：分类任务中不同类别的训练样例数目差别很大，会对学习过程造成困扰。

假定正类样例少，反类样例多。

解决方法

一、再缩放
在logstic回归分类模型中，输出的y值实际上与一个阈值进行比较，当y>0.5时，判断为正例，否则为反例。由于y>0,所以y实际上表示的是预测结果为正例的可能性。
1.当正反例个数相同时：

若 y 1 - y > 1 ， 则 判 断 为 正 例 。 反 之 为 反 例 ；

$若\frac{y}{1-y} >1，则判断为正例。反之为反例；$
2.当正反例个数不同，正例m^+，反例m^-，观测几率：

m+m− $\frac {m^+}{m^-}$ ，设训练集是真实样本中的无偏采样（训练集的类别比例=真实样本总体类别比例），则：

若 y 1 - y > m + m - ， 则 预 测 为 正 例 。

$若\frac{y}{1-y} >\frac {m^+}{m^-} ，则预测为正例。$
对预测值进行调整：

y ' 1 - y ' = y 1 - y * m + m - > 1 \cdot \cdot \cdot \cdot \cdot \cdot \cdot \cdot @ ， 则 预 测 为 正 例

$\frac{y’}{1-y’}=\frac{y}{1-y} *\frac {m^+}{m^-} >1········@，则预测为正例$
实际上训练集无法做到无偏采样。。。因此无法基于观测几率来推出真实几率，常用的技术有三类：

欠采样
除去一些反例，使得正反例的数目相同
过采样
增加一些正例数目，使得两类的数目相同
阈值移动
基于原始训练集进行学习，但用训练好的分类器进行学习的时候，将公式@嵌入到决策过程中。

三类技术特点：
+欠采样开销小于过采样；
+过采样不能简单的对初始样本重复采样，易导致过拟合现象；
+过采样代表性算法SMOTE；欠采样代表算法EasyEnsemble

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
对类别不平衡问题的解决方法

基本概念类别不平衡：分类任务中不同类别的训练样例数目差别很大，会对学习过程造成困扰。假定正类样例少，反类样例多。解决方法一、再缩放在logstic回归分类模型中，输出的y值实际上与一个阈值进行比较，当y>0.5时，判断为正例，否则为反例。由于y>0,所以y实际上表示的是预测结果为正例的可能性。 1.当正反例个数相同时：若y1−y>1，则判断为正例。反之为反例；若\fra
复制链接

扫一扫

专栏目录

loveitlovelife CSDN认证博客专家 CSDN认证企业博客

码龄7年

90: 原创

5万+: 周排名

2万+: 总排名

11万+: 访问

: 等级

1832: 积分

138: 粉丝

83: 获赞

29: 评论

235: 收藏

私信

关注

热门文章

分类专栏

最新评论

web安全-跨站脚本攻击XSS
百锦再@新空间代码工作室: 这篇关于web安全中跨站脚本攻击XSS的文章简直是犹如一束明亮的光芒，深入浅出地解释了XSS的原理和危害，让我们对网络安全问题有了更清晰的认识。作者深入浅出地解释了XSS攻击的工作原理，为我们揭示了网络安全的重要性。这篇文章不仅让我们了解了XSS攻击的原理，更让我们认识到在网络世界中保护个人信息的重要性。感谢作者为我们提供了如此详尽而深刻的解析，期待更多的精彩文章！
web安全-跨站脚本攻击XSS
ha_lydms: 我很喜欢作者对于时事的评论，总是能够给出独到的见解。
web安全暴力破解-SQL注入简介
普通网友: 文章结构严谨有条,层次分明,读起来一点也不费劲，让人受益匪浅。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
向量检索的索引构建算法综述
CSDN-Ada助手: 多亏了你这篇博客, 解决了问题: https://ask.csdn.net/questions/7989251, 请多输出高质量博客, 帮助更多的人
Elatstic search 8.0 在nlp任务中的实践
山塘小鱼儿: If this is a private repository, make sure to pass a token having permission to this repo with `use_auth_token` or log in with `huggingface-cli login` and pass `use_auth_token=True`.

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。