首先看一组失衡数据:
这组数据01比率严重失调这会对我们以后的预测值大大减小所以我们需要对它进行处理
#进行失衡处理
perc.over=100:表示少类别样本数=151+151*100%=302
perc.under=200:表示多类样本数(新增少数样本数200%=151200%=302)
hyper_new <- SMOTE(target~.,hyper,perc.over = 100,
perc.under = 200)
利用SOMTE函数可以对我们的两组数据进行处理
最后会形成两组是1:1的情况
如果不想是1:1可以根据改变perc.over和perc.under的参数来处理二者分别代表网上调比例和往下调比例