SMOTE-D在Bordeline SMOTE进行改进,解决了少数类生成时随机生成的问题,提高了可解释性。
SMOTE与其他方法相结合的方法有:
1.噪声滤波器
2.子采样方法(smote-RSB)
3.特征选择器(E-SMOTE)
4.修改SMOTE(Bordeline—SMOTE)
- Bordeline SMOTE
1.只对少数类中边界进行过采样,然后由这些对象生成合成对象
2.寻找边界的方法:
(1)对于少数类中每一个对象,计算整个训练集中的最邻近对象
(2)如果最邻近对象中包括多数类和少数类,且多数类邻居数量多于少数类邻居的数量,则被成为边界。 - SMOTE-D
1.计算要为少数类生成的对象的数量(n=(M-m)*R)R为0~1中的一个数
2.计算少数类中的每个目标和他的近邻之间的距离
3.计算每个目标与其k个近邻之间距离的标准差(σi)
4.计算每个距离(dij)的分数(pij)与每个目标及其近邻的距离之和的比例
5.计算要在一个对象和它的一个最近邻居间生成的对象数sij ;
6.获取每一个对象和每一个对象之间的差异diffi
(1)将一个对象与其每个相邻对象之间的差值除以该对生成的合成对象的数量加1
(2)将差值diff’添加到m少数类的对象的标准差之中,次数等于生成对象的次数
7.将生成的合成对象添加到少数类 - 原文:
论文题目:SMOTE-D a Deterministic Version of SMOTE