李航《统计机器学习》第5章决策树

cutie吖

于 2016-06-25 23:59:18 发布

阅读量2k

点赞数

分类专栏：读书笔记文章标签：机器学习李航决策树

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/icecutie/article/details/51760793

版权

本文详细介绍了决策树模型，包括其在分类和回归问题中的应用、损失函数、特征选择、决策树生成和剪枝策略。重点讨论了ID3、C4.5和CART算法，并解释了信息增益和信息增益比的概念。此外，还提到了决策树的过拟合问题及剪枝方法，以及CART算法和随机森林的简要介绍。

摘要由CSDN通过智能技术生成

决策树模型

用来解决分类和回归问题，可以看成是一个if-then规则的集合，或者看做一个条件概率分布
优点：具有可读性，分类速度快
决策树由结点和有向边组而成，内部结点表示一个feature，叶节点表示一个class

决策树的学习

损失函数通常选择正则化的极大似然函数i.e.结构风险最小化
包括特征选择，决策树生成和剪枝三部分
常用的算法有ID3,C4.5,CART

特征选择

选择的准则是信息增益or信息增益比
复习一下熵的定义

熵 (entropy)是表示随机变量不确定性的度量

假设X是一个取值个数有限的离散随机变量，概率分布为
$P(X = X_i) = p_i , i = 1,2,...,n$
则随机变量X的熵为（由于熵大小只和X分布有关，有时直接记作H(p)
$H(X) = -\sum^n_{i=1}p_ilog p_i$
熵越大，随机变量的不确定性越大
$0 <= H(p) <= log n$
假设X,Y 服从联合概率分布
$P(X=X_i,Y=y_j) = p_ij$
条件熵定义为
H(Y|X)=∑ni

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
李航《统计机器学习》第5章决策树

决策树ID3C4.5CART随机森林GBDT
复制链接

扫一扫

专栏目录

cutie吖 CSDN认证博客专家 CSDN认证企业博客

码龄14年

27: 原创

111万+: 周排名

175万+: 总排名

5万+: 访问

: 等级

741: 积分

18: 粉丝

10: 获赞

3: 评论

18: 收藏

私信

关注

热门文章

分类专栏

最新评论

《统计学习方法》第三章 K-means算法
一眼十年ing: k-means是聚类方法，统计学方法讲的是K紧邻，不要误人子弟好么
Coursera_机器学习_week4&5_神经网络
hanaif 回复 captain堂吉诃德: 你好，我是这样理解，上面函数有定义IrCostFunction(theta, X, y, lambda)，在无约束最小化函数里@后面的t表示的是需要改变的值，所以我觉得这个t就表示theta，至于为什么要这样，我现在也是匪夷所思，如果你想通了，可以说一下吗。谢谢
Coursera_机器学习_week4&5_神经网络
captain堂吉诃德: 楼主你好，我想问一下theta = fmincg (@(t)(lrCostFunction(t, X, (y == c), lambda)), initial_theta, options);中IrCostFunction函数中的t是如何来的，原文中没见他的定义，他的值是随机生成的吗？谢谢啦

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。