非平衡数据的处理

最新推荐文章于 2022-08-16 20:48:58 发布

shaoyue1234

最新推荐文章于 2022-08-16 20:48:58 发布

阅读量326

点赞数

分类专栏：非平衡数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/shaoyue1234/article/details/118156787

版权

非平衡数据专栏收录该内容

6 篇文章 0 订阅

订阅专栏

非平衡数据的处理

算法层面
数据层面
特征层面
参考文献：

算法层面

代价敏感学习

核心思想：少数类样本更高代价
代表做法：

代价矩阵
META-cost：根据最小期望代价修改训练数据的类标记，加入到新的学习过程中

集成学习

核心思想：集成多个弱分类器
代表算法：

Boosting
Bagging
AdaBoost：迭代过程中更新样本权重，增加错分样本权重
EasyEnsemble：多数类样本划分成子集，每个子集分别训练
BalanceCascade：建立在EasyEnsemble基础上，迭代过程中删除被分类正确的多数类样本
SMOTEBoost：增加合成样本
RUSBoost：随机欠采样样本
PCBoost：随机过采样样本

单类学习

核心思想：只对一个类进行学习
代表算法：

SVDD
One-class SVM

数据层面

过采样

核心思想：增加少数类样本
代表算法：

随机过采样：随机重复少数类样本
SMOTE：找出少数类样本m的k近邻（少数类），在k金链之间的连线上产生随机的合成样本，根据不平衡比例设置采样倍率，确定最终生成的新样本。
Borderline-SMOTE：找位于边界的少数类样本，利用危险样本产生新样本
ADASYN
Haibo He根据样本的危险程度，也就是少数类样本在学习中的难易程度，通过加权的方法，构造合成样本的分布函数，来确定合成新样本的数目。
CBO：基于聚类的抽样算法。

欠采样

核心思想：删除多数类样本
代表算法：

随机欠采样：随机删除多数类样本
One-SidedSelection：将多数类样本分为四种类型：噪声、边界、冗余和正常，只保留正常样本
NCL
Tomek links
OOS
NearMiss
BCS

混合采样

核心思想：过采样与欠采样相结合

特征层面

分类器无关

过滤式：FILTER

分类器独立

封装式：WRAPPER

分类器结合

嵌入式：EMBEDDED

参考文献：

面向非平衡数据的过采样方法研究_周晓敏
基于聚类的非平衡数据欠采样算法研究及应用_张雪
非平衡数据重采样方法研究_段冰倩

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
非平衡数据的处理

算法层面代价敏感学习核心思想：少数类样本更高代价代表做法：代价矩阵集成学习核心思想：集成多个弱分类器代表算法：BoostingBaggingAdaBoost：迭代过程中更新样本权重，增加错分样本权重EasyEnsemble：多数类样本划分成子集，每个子集分别训练BalanceCascade：建立在EasyEnsemble基础上，迭代过程中删除被分类正确的多数类样本PCBoost单类学习核心思想：只对一个类进行学习代表算法：SVDD数据层面过采样核心思想：
复制链接

扫一扫

专栏目录

shaoyue1234 CSDN认证博客专家 CSDN认证企业博客

码龄10年

41: 原创

7万+: 周排名

216万+: 总排名

8万+: 访问

: 等级

1131: 积分

40: 粉丝

46: 获赞

13: 评论

400: 收藏

私信

关注

热门文章

分类专栏

最新评论

数据增强——时间序列
Mint-V: Le Guennec A, Malinowski S, Tavenard R. Data augmentation for time series classification using convolutional neural networks. In: IWAATD; 2016.
数据增强——时间序列
weixin_51536045: 请问您找到对应的文章了嘛？
视频异常检测——Robust Anomaly Detection in Videos Using Multilevel Representations
一只喻: 那如何通过生成的异常检测图来判断该视频是否有异常呢？
parallels desktop 中ubuntu忘记密码
木偶vz: 重启后看提示，有些是眼 Esc，注意不要按太快，进入后任选一个 recovery mode，再选择root登入就可以操作了
视频异常检测——Anomaly Detection in Video via Self-Supervised and Multi-Task Learning
研途可达: 研究动机描述应该是: 通过单个代理任务建模异常事件检测，例如。由于代理任务和实际的（异常检测）任务之间缺乏完美的对齐。为了减少模型对异常检测任务的不对齐性，我们建议通过在多个代理任务上联合优化模型来进行训练。关于代理任务的不对齐性：可以这么理解，就是代理任务（proxy task）并不是主要用来解决异常检测的，而是使用代理任务的结果作为异常检测的参考度量，所以会有一定的在检测方面的的不对齐性。个人理解，如有误，请批评指正。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。