初识随机森林 随机森林(Random Forest) 随机森林的 feature_selection原理 随机森林回归 简单对比AdaBoost 小结 决策树的难点在于如何设计每一步的问题。 过拟合其实正是决策树的一般属性——决策树非常容易陷得很深,因此往往会拟合局部数据(易受噪声影响),而没有对整个数据分布的大局观。 随机森林(Random Forest) 而随机森林作为bagging算法的一个拓展变体,利用集成学习,以多颗决策树为基学习器,最后结合。每个学习器采用自主采样法以保证学习前之间一定的独立性,同时留下样本可用于“