决策树和随机森林

logooooooogol

于 2017-12-23 23:01:08 发布

阅读量546

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/freenl/article/details/78882785

版权

机器学习专栏收录该内容

9 篇文章 0 订阅

订阅专栏

决策树->随机森林；
随机森林的难点是如何建立决策树；
根节点ROOT：1，2，3。。。N个样本，给定规则（选取特征）给ROOT进行分类，假设分成C_1，C_2,如果是连续直接分类，如果是连续，那么给定阈值进行分类，递归形成的树，即是决策树，多个决策树即形成随机森林；
决策树：CART:classification and regression tree；
决策树：训练速度快，使用场景多；
熵是度量随机变量不确定性的量，越小随机性越小，越大表示随机性越大，也可表示其蕴含的信息量；
事件发生的概率越小，其蕴含的信息量越大，熵越大；
香浓定理：信息熵， $H=-\sum_{i=1}^{n}p_{i}*logp_{i}$
H(X),H(Y),H(X,Y)

条件熵：
H(Y|X)=H(X,Y)-H(X)= $-\sum_{x,y}p(x,y)*logp(y|x)=\sum_{x}p(x)H(Y|X=x)$

给定均值后：均匀分布熵最大；
给定均值和方差后：正态分布熵最大；

相对熵：互熵，交叉熵，鉴别信息，kullback熵，kullback-leible散度；
用来度量两个随机变量的距离；

p(x),q(x)是X中取值的两个概率分布，则p对q的相对熵是：
$D(p||q)=\sum_{x}p(x)log \frac{p(x)}{q(x)} =E_{p(x)}log\frac{p(x)}{q{(x)}}$

互信息：两个随机变量X,Y的互信息，定义为X,Y的连个分布和独立分布乘积的相对熵；
I(X,Y)=D(P(X,Y)||P(X)P(Y))= $\sum_{x,y}p(x,y)log\frac{p(x,y)}{p(x)*p(y)}$

H(Y)-I(X,Y)=H(Y|X)
I(X,Y)=H(X)+H(Y)-H(X,Y)

H(X|Y)<=H(X);

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

logooooooogol CSDN认证博客专家 CSDN认证企业博客

码龄13年

17: 原创

48万+: 周排名

149万+: 总排名

1万+: 访问

: 等级

295: 积分

1: 粉丝

1: 获赞

1: 评论

4: 收藏

私信

关注

热门文章

分类专栏

最新评论

最大似然估计理解
logooooooogol: 通过已知数据D，学习出其分布规律；首先要找出其服从什么分布，比如高斯，指数...，这个过程我理解为就是寻找模型的过程，然后根据似然函数求得对应分布的参数，这个过程即在参数（假设）空间里找到那个最佳的！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。