由于样本极其不均衡,有两种解决办法: 1.下采样:减少较多的样本,使两者均衡。交叉验证是求稳的工作,可以提高预测的准确性。 2.过采样:构造少量的样本,使两者均衡。 交叉验证:在训练集分成若干份,用其中数据检验模型,提高准确性。