2018年7月22日 阵雨
感冒发烧喉咙疼,只因为一杯正常冰的奶盖!!!以后得少喝加冰的东西了.
前面说的是集成学习的两种形式,这跟随机森林有啥关系呢?
随机森林是Bagging的一个扩展变体.简单的来说,当Bagging算法中的base learner为决策树并在训练决策树的过程中加入随机属性选择,这就是随机森林的由来.
我们知道,传统的决策树的构建是在当前结点的属性集合(假定有d个属性)中,选择一个最优属性;再看随机森林,由Bagging算法看出来,有一个自助采样的过程,随机森林对于基决策树的每个结点,先从该结点的属性集合中随机选择一个包含k个属性的子集,然后再从这个子集中选择一个最优属性用于划分.参数k控制了随机性的引入程度:若令k=d,则基决策树的构建与传统决策树相同;若k=1,则是随机选择一个属性用于划分;一般情况下,推荐值.