根据这个定义[1]
随机森林是一种元估计器,它在数据集的不同子样本上拟合多个决策树分类器,并使用平均来提高预测精度和对拟合的控制。子样本大小始终与原始输入样本大小相同,但如果bootstrap=True(默认),则使用替换方法绘制样本。
注:子样本大小始终相同
但如果bootstrap=True(默认),则使用替换方法绘制样本。
所以
Bootstrap=True(默认):使用替换项绘制示例
Bootstrap=False:不替换地抽取样本
[2]在不更换样本的情况下,每一个样本单元的样本中只有一个可供选择的机会。例如,如果抽取一个简单的随机样本,使得样本中没有任何单位出现超过一次,则抽取样本时不需要替换。
从视觉上你可以想象,从一袋球(样本)中,你选择M
那就是你的1号子集,有M个球。
现在,如果你在为你的子集2取另一个M之前把球放进袋子里,那么你就要“用替换来画”(bootstrap=True)
但是,如果你把子集1放在一边,从你的子集2的袋子里再捡一个M球,那么子集1中的球都不能在子集2(或任何其他子集)中,因为你“不替换地画”(bootstrap=False)