Random forest中out-of-bag data占原数据集的30%-40%
神奇的1/3今天在看Berkeley的网页学习随机森林,有一个很小的细节总是搞不懂,一直抓耳挠腮。在定义out-of-bag data时,Leo Breiman说剩下没被bootstrap抽中的样本大概有1/3。为什么是三分之一呢?这让我一直想不清楚,最后在stackoverflow上看到了答案。(果然stackoverflow上就是大神多)考虑一个样本量为NNN的集合,对它做一个样本量也是N...
原创
2020-04-04 22:05:39 ·
855 阅读 ·
1 评论