机器学习（一）决策树与随机森林（1）

最新推荐文章于 2022-02-06 16:32:02 发布

哎呦哎呦哎呦DJ

最新推荐文章于 2022-02-06 16:32:02 发布

阅读量310

点赞数

分类专栏：机器学习文章标签：机器学习(理论) 决策树随机森林

本文链接：https://blog.csdn.net/gs_upupup/article/details/96138038

版权

机器学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

机器学习（一）决策树与随机森林（1）

可以做回归、分类

内容：

 信息熵
 	熵，联合熵，条件熵，互信息 √
 决策树学习算法
 	信息增益
 	ID3，C4.5，CART
 Bagging与随机森林

多个决策树建立===形成随机森林，决策的最终结果的和为最终值

做分类的时候用的是熵值决策树的分类有明显的锯齿
做回归的时候用的可能就是均方，方差等准则

理论

决策树： level

构造决策树的重点：

对每一个结点如何分类，如何划分可以使分类鲜明

度量不同划分方法的工具：熵

熵：信息含量的量化指标，可以用来做系统方程化的目标或参数依据
具体参考 https://www.cnblogs.com/daguonice/p/11179662.html
其中
熵不能为负

信息熵的公式

H(x)=-∑p(xi)log2⁡(p(xi))

p(xi)表示事件xi发生的概率

对公式的解释
让概率可加：求对数
让熵非负：式子前加负号
对每一个xi有不同的对数值和概率值
因此对事件X求期望就得到上述公式H(x)

联合熵、条件熵、互信息
联合熵
相应的，可得X,Y的联合熵就是把P(X)变成联合分布的P(X,Y)
条件熵
对上述熵值， H(X,Y) – H(X)就表示在X发生的前提下，Y的熵H(Y|X)
互信息
H（X,Y）- H(Y)=H(X|Y)
有H(X)+H(Y)-H(X,Y)=I(X,Y) 表示互信息
同时可以有
H（Y|X）=H（Y）- I（X，Y）
============ 延伸===============
交叉熵