1欠采样、过采样
欠采样:减少多数类的数量(如随机欠采样、NearMiss、ENN)。
过采样:尽量多地增加少数类的的样本数量(如随机过采样、以及2.1.2数据增强方法),以达到类别间数目均衡。
还可结合两者做混合采样(如Smote+ENN)。
具体还可以参见【scikit-learn的imbalanced-learn.org/stable/user_guide.html以及github的awesome-imbalanced-learning】
欠采样:减少多数类的数量(如随机欠采样、NearMiss、ENN)。
过采样:尽量多地增加少数类的的样本数量(如随机过采样、以及2.1.2数据增强方法),以达到类别间数目均衡。
还可结合两者做混合采样(如Smote+ENN)。
具体还可以参见【scikit-learn的imbalanced-learn.org/stable/user_guide.html以及github的awesome-imbalanced-learning】