MWMOTE:带多数类权重的少数类样本过采样

MWMOTE是一种针对不平衡数据集的过采样技术,旨在解决少数类样本不足的问题。它通过计算样本的邻居,并依据距离和密度因素赋予信息权重,以创建新的少数类样本。算法包括寻找少数类和多数类的邻居,计算信息权重,归一化权重,以及使用SMOTE方式进行插值,以增加少数类样本数量。
摘要由CSDN通过智能技术生成

比较新的论文引用较少,网上具体的算法介绍就更少,这里我就当为自己做了一些烂笔头的工作。有什么错误的地方恳请指正

MWMOTE全称—Majority Weighted MinorityOversampling Technique for ImbalancedData Set Learning

这篇论文是一篇IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING,中科院二区,影响因子3.438的文章

算法介绍如下:

1)少数类的样本总数记为Smin

    对每个属于少数类Smin的样本根据欧式距离计算它的k1个邻居,其中属于少数类的记为NN(xi)

2)若NN(xi)=0表示第i个少数类样本附近的k1个邻居没有少数类样本,该样本为噪声样本

    用Sminf代表Smin去掉噪声样本后剩下的样本数量

3)对每个属于少数类Sminf的样本根据欧式距离计算它的属于多数类的k2个邻居,记为Nmaj(xi)

4)将3)的结果取并集得到多数类边界数据集,记为Sbmaj

5)对每一个属于Sbmaj的样本根据欧氏距离计算它的属于少数类的k3个邻居,记为Nmin(yi)

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值