理解:有n个样本,每棵树有放回的取n次,大概有36.8%的样本在这颗树上没有被取到。
关于36.8%的计算公式如下:
概率当样本数量=1000的时候,p约等于36.8%,样本数量越大,p约接近于36.8%。
换句话说,每个样本不在约36.8%的树里。袋外误差是用每棵树中每一个没有被选到的样本,经过不包含这个样本的树投票决定预测结果,再与真实值比较误差。
理解:有n个样本,每棵树有放回的取n次,大概有36.8%的样本在这颗树上没有被取到。
关于36.8%的计算公式如下:
概率当样本数量=1000的时候,p约等于36.8%,样本数量越大,p约接近于36.8%。
换句话说,每个样本不在约36.8%的树里。袋外误差是用每棵树中每一个没有被选到的样本,经过不包含这个样本的树投票决定预测结果,再与真实值比较误差。