oversampler=SMOTE(random_state=0)
random_state:指定SMOTE算法选定种子时是否随机。
就是以上公式的
x
i
x_i
xi是否随机选取。
以上函数只是定义了一个类,真实实现功能的是其类函数:
oversampler.fit_sample(features_train,labels_train)
features_train:特征集
labels_train:标签集
注意:该函数自动判断哪个是少数不平衡的类别,所以输入时将整体的训练集输入即可,不用将少数集预先提出。