- 博客(1)
- 收藏
- 关注
原创 机器学习——样本不均衡的处理方式
本片博文主要是对机器学习的分类问题中存在的样本不均衡情况的处理说明,具体如下: 当对数据进行分类训练的时候,有时候会出现原始数据样本不均衡的情况,也就是正例与反例样本数量存在差异。此时为了能够更好的训练模型,需要对原始数据进行“过采样”或“下采样”来使得训练数据分布均衡。 过采样:让正反例样本一样多,通常是对较少的数据进行数据生成,让其与较多的数据一样多。 下采样:让正反例样本一样少,通常是对较多...
2019-01-07 14:19:40 2032
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人