[资源整理]几个经典的用于不平衡回归Imbalanced regression的采样方法以及代码资源


前言

众所周知,不平衡回归相比于不平衡分类是一个很少被关注的话题. 因需要,笔者整理一些用于处理imbalanced regression的data level方法.

SMOGN

原始论文:
Branco, P., Torgo, L., Ribeiro, R. (2017). SMOGN: A Pre-Processing Approach for Imbalanced Regression. Proceedings of Machine Learning Research, 74:36-50. http://proceedings.mlr.press/v74/branco17a/branco17a.pdf.

该方法的官方实现是基于R语言, 该方法目前已经被收录进Python包(smogn)中, 可通过如下命令安装使用,

pip install smogn

项目地址见:https://github.com/nickkunz/smogn

SMOTE

原始论文:
Chawla N V, Bowyer K W, Hall L O, et al. SMOTE: synthetic minority over-sampling technique[J]. Journal of artificial intelligence research, 2002, 16: 321-357. https://www.jair.org/index.php/jair/article/download/10302/24590
SMOTE及其各种变体的实现大集合见项目:https://github.com/analyticalmindsltd/smote_variants

SMOTE用于Regression的应用论文:

  1. Torgo L, Ribeiro R P, Pfahringer B, et al. Smote for regression[C]//Progress in Artificial Intelligence: 16th Portuguese Conference on Artificial Intelligence, EPIA 2013, Angra do Heroísmo, Azores, Portugal, September 9-12, 2013. Proceedings 16. Springer Berlin Heidelberg, 2013: 378-389.
  2. Camacho L, Douzas G, Bacao F. Geometric SMOTE for regression[J]. Expert Systems with Applications, 2022: 116387.

DA-WR (Data Augmentation - Weighted Resampling)

论文: Data Augmentation for Imbalanced Regression, AISTATS 2023.
代码链接: https://github.com/sstocksieker/DAIR.

REBAGG: REsampled BAGGing for Imbalanced Regression

论文: REBAGG: REsampled BAGGing for Imbalanced Regression, LIDTA 2018.

基本思路: 结合了集成学习Bagging

学位论文:

Thesis, Re-sampling Approaches for Regression Tasks under Imbalanced Domains, 2014.

ImbalancedLearningRegression

原始论文:
Branco P. ImbalancedLearningRegression-A Python Package to Tackle the Imbalanced Regression Problem[J]. 2022.https://2022.ecmlpkdd.org/wp-content/uploads/2022/09/sub_1456.pdf

该方法已经被收录进Python包 (ImbalancedLearningRegression)中,可通过如下命令安装使用,

pip install ImbalancedLearningRegression

官方项目地址:https://github.com/paobranco/ImbalancedLearningRegression.

总结

虽然不多,应该还有,后面再补充…

上面提到的这些基本上都是应用到人工 构造特征的数据集上, 如何将其应用到端到端的深度学习方法中值得进一步研究,

此方方面的研究工作见:
Dablain D, Krawczyk B, Chawla N V. DeepSMOTE: Fusing deep learning and SMOTE for imbalanced data[J]. IEEE Transactions on Neural Networks and Learning Systems, 2022. https://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=9694621, 发表于顶刊IEEE TNNLS, 膜拜.

总结

后续再补充

  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

MasterQKK 被注册

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值