最大信息熵增益_决策树与随机森林（1）—模型构建（信息增益）

最新推荐文章于 2023-10-12 08:44:14 发布

无可就是九头鸟

最新推荐文章于 2023-10-12 08:44:14 发布

阅读量657

点赞数

文章标签：最大信息熵增益

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_29048775/article/details/112512964

版权

首先举一个决策树的例子：

这是一个抽象的决策树。

决策树与回归模型的比较：

线性回归：连续性数据（例如预测明天的收益率）
决策树：主要分类问题（例如预测明天股价是否上升），也可以是连续性

2. 决策树的构建

2.1 构建原则

随着决策树深度(决策树的高度）的增加，节点的熵值（不确定性）迅速降低。
构建的决策树的深度不要过深（数不能太高）：防止过拟合问题

2.2 选择结点

2.2.1 信息熵

2.2.1.1信息熵的含义

。

例如由上图，为什么是先选择是否出现财务问题，而不是先选择是否行业前景较好呢？这里用到的是信息熵。熵是对平均不确定性的度量。熵越大，数据的不确定性越高，熵越低，不确定性最低。其中pi是指，每个信息所占的比例。

2.1.1.2 信息熵的计算

例1：是否出现财务问题这个信息中，出现财务问题的公司数量为100家，没有出现财务问题的公司数量为300家，那么p1=0.25，p2=0.75. H=-0.25log2(0.25)-0.75log2(0.75)=0.81

例2：是否出现财务问题这个信息中，出现财务问题的公司数量为200家，没有出现财务问题的公司数量为200家，那么p1=0.5，p2=0.5. H=-0.5log2(

最低0.47元/天解锁文章

无可就是九头鸟

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
最大信息熵增益_决策树与随机森林（1）—模型构建（信息增益）

首先举一个决策树的例子：这是一个抽象的决策树。决策树与回归模型的比较：线性回归：连续性数据（例如预测明天的收益率）决策树：主要分类问题（例如预测明天股价是否上升），也可以是连续性2. 决策树的构建2.1 构建原则随着决策树深度(决策树的高度）的增加，节点的熵值（不确定性）迅速降低。构建的决策树的深度不要过深（数不能太高）：防止过拟合问题2.2 选择结点2.2.1 信息熵2.2.1.1信息熵的含义 ...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。