sklearn 决策树例子_通俗地说决策树算法（二）实例解析

最新推荐文章于 2023-04-16 15:37:19 发布

weixin_39911998

最新推荐文章于 2023-04-16 15:37:19 发布

阅读量467

点赞数

文章标签： sklearn 决策树例子

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39911998/article/details/112369402

版权

前情提要：通俗地说决策树算法（一）基础概念介绍

一. 概述

上一节，我们介绍了决策树的一些基本概念，包括树的基本知识以及信息熵的相关内容，那么这次，我们就通过一个例子，来具体展示决策树的工作原理，以及信息熵在其中承担的角色。

有一点得先说一下，决策树在优化过程中，有3个经典的算法，分别是ID3，C4.5，和CART。后面的算法都是基于前面算法的一些不足进行改进的，我们这次就先讲ID3算法，后面会再说说它的不足与改进。

二. 一个例子

众所周知，早上要不要赖床是一个很深刻的问题。它取决于多个变量，下面就让我们看看小明的赖床习惯吧。

OK，我们随机抽了一年中14天小明的赖床情况。现在我们可以根据这些数据来构建一颗决策树。

可以发现，数据中有三个属性会影响到最终的结果，分别是，季节，时间是否过8点，风力情况。

要构建一颗决策树，首先我们要找到它的根，按照上一节所说，我们需要计算每一个属性的信息熵。

在计算每一个属性的信息熵之前，我们需要先根据历史数据，计算没有任何属性影响下的赖床信息熵。从数据我们可以知道，14天中，有赖床为8天，不赖床为6天。则

p(赖床) = 8 / 12.
p(不赖床) = 6 / 12.

信息熵为

H(赖床) = -(p(赖床) * log(p(赖床)) + p(不赖床) * log(p(不赖床))) = 0.89

接下来就可以来计算每个属性的信息熵了&#

最低0.47元/天解锁文章

weixin_39911998

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
sklearn 决策树例子_通俗地说决策树算法（二）实例解析

前情提要：通俗地说决策树算法（一）基础概念介绍一. 概述上一节，我们介绍了决策树的一些基本概念，包括树的基本知识以及信息熵的相关内容，那么这次，我们就通过一个例子，来具体展示决策树的工作原理，以及信息熵在其中承担的角色。有一点得先说一下，决策树在优化过程中，有3个经典的算法，分别是ID3，C4.5，和CART。后面的算法都是基于前面算法的一些不足进行改进的，我们这次就先讲ID3算法，后面会再说说它...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。