《统计学习方法》 - 决策树

最新推荐文章于 2022-11-12 20:12:46 发布

weixin_37889021

最新推荐文章于 2022-11-12 20:12:46 发布

阅读量127

点赞数

分类专栏：统计学

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_37889021/article/details/79263046

版权

统计学专栏收录该内容

5 篇文章 0 订阅

订阅专栏

5.1 决策树模型

从根节点开始，对实例进行测试，将测试完的实例分布到子节点，之后递归的对实例进行测试，直至达到叶节点并将实例分配到叶节点的类中

互斥且完备：每一个实例都被一条路径或一项规则所覆盖，且只被一条路径或一项规则所覆盖

对特征空间进行划分，每一个小矩形都是一个单元，类的条件概率分布如下图所示

当P(Y=1 | X=c) > 0.5时，则认定该单元为属于正类

决策树的损失函数通常是正则化的最大似然函数，学习的策略就是使损失函数最小化

决策树的构建：构建根节点，将所有实例都放入根节点中，找到一个最优特征分类方法，将实例分成多个子集并传递到子节点上，如果无须继续分类，则将其划入叶节点的类中；如尚不能被正确分类，则对其递归划分子集，直到能够正确分类后放入叶节点的类中

由于上述方式的构建可能发生过拟合，因此需要对决策树进行一定的剪枝，提高泛化能力

如果特征向量过多，也可以在构建开始前，对特征进行一定的选择后再构建决策树

5.2 特征选择

5.2.1 信息增益

熵：随机变量不确定性的度量

条件熵：在已知随机变量X的条件下随机变量Y的不确定性

信息增益：得知特征X的信息使得Y的不确定性减少的程度

weixin_37889021

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
《统计学习方法》 - 决策树

5.1 决策树模型从根节点开始，对实例进行测试，将测试完的实例分布到子节点，之后递归的对实例进行测试，直至达到叶节点并将实例分配到叶节点的类中互斥且完备：每一个实例都被一条路径或一项规则所覆盖，且只被一条路径或一项规则所覆盖对特征空间进行划分，每一个小矩形都是一个单元，类的条件概率分布如下图所示当P(Y=1 | X=c) > 0.5时，则认定该单元为属于正类
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。