随机森林是集成方法中优势非常强的一种方法,它以决策树为基础学习器,每棵树独立建立,天然具有并行特性,相对于GradientBoosting和Bagging方法而言,它耗内存更大,速度也相对慢些,但能获得更稳定的结果,尤其是在与CV验证相结合时,泛化能力大大增强。
- 决策树基本算法
- 随机森林算法
- 应用随机森林
1、决策树基本算法
(1)寻找最优化分节点的办法有信息增益量和GINI系数:
①信息增益量:
随机森林是集成方法中优势非常强的一种方法,它以决策树为基础学习器,每棵树独立建立,天然具有并行特性,相对于GradientBoosting和Bagging方法而言,它耗内存更大,速度也相对慢些,但能获得更稳定的结果,尤其是在与CV验证相结合时,泛化能力大大增强。
1、决策树基本算法
(1)寻找最优化分节点的办法有信息增益量和GINI系数:
①信息增益量: