有放回抽样
- 有放回每次抽取结果不一定相同。
- 无放回每轮抽取结果都相同。
![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/f9157e469ae34ab49aedd432cc01bc05.png)
随机森林
多个弱分类器组合成的强分类器。
(1)每次有放回地从训练集中取出 n 个训练样本,组成新的训练集;
(2)利用新的训练集,训练得到M个子模型;
(3)对于分类问题,采用投票的方法,得票最多子模型的分类类别为最终的类别;对于回归问题,采用简单的平均方法得到预测值。
随机森林鲁棒性比决策树更好:
随机森林已经用很多进行了细小修改的数据集来训练算法,并进行平均,所以即便训练集发生一些小变化,也不会对最终输出有很大影响。
更加详细讲解随机森林的文章
参考文章