三、决策树
1.决策树模型的原理
1)什么是决策树
2)决策树模型原理
3.构建决策树的目的
4)决策树的优缺点
2.决策树的典型生成算法
1)常用的特征选择有信息增益、信息增益率、基尼系数
2)基于信息增益的ID3算法
3)基于信息增益率的C4.5算法
4)基于Gini系数的CART算法
5)CART树连续变量与离散变量的处理
6)不同决策树算法的比较
3.算例
四、随机森林
1.集成学习
2.随机森林原理
1)定义
2)建模步骤
3)优缺点
补充:HEU的决策树
随机变量的熵 H(Y)
条件熵 H(Y|A)
信息增熵 G(A) = H(Y) - H(Y|A)
回归树
补充:HEU的随机森林