文章目录 一、决策树1.信息熵1)熵2)联合熵与条件熵3)相对熵4)互信息总结 2.决策树学习算法1)信息增益-ID32)信息增益率-C4.53)CART-gini系数总结4)决策树的评价5)决策树过拟合 二、Bagging与随机森林1.Bagging2.随机森林3.样本不均衡的常用处理方法4.样本间相似度5.特征重要度6.异常检测 一、决策树 1.信息熵 1)熵 2)联合熵与条件熵 3)相对熵 4)互信息 总结 互信息的另一种表述方式 2.决策树学习算法 1)信息增益-ID3 符号含义 2)信息增益率-C4.5 3)CART-gini系数 见上 总结 4)决策树的评价 5)决策树过拟合 二、Bagging与随机森林 1.Bagging 2.随机森林 3.样本不均衡的常用处理方法 4.样本间相似度 5.特征重要度 6.异常检测