算法-决策树（分类算法）

最新推荐文章于 2024-06-18 15:40:50 发布

孟德尔的豆豆

最新推荐文章于 2024-06-18 15:40:50 发布

阅读量662

点赞数

分类专栏：算法模型数据分析模型文章标签：决策树机器学习算法 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44055784/article/details/108418971

版权

决策树算法（DecisionTree）

决策树是机器学习中常用的分类算法

决策树顾名思义是一种树形结构，而我们的任务就是想办法构建出这样一颗树用它来进行分类。

构建过程：

1. 选择一个对象的特征，并根据这一训练集进行分类

2.计算某特征分类结果的混乱程度

（对于对混乱结果的情况评估，使用了的以下方法）

信息熵：

信息熵就是用来衡量一个随机变量取值的不确定性的一个指标，信息熵越大则不确定性越大，信息熵越小则不确定性也就越小。
信息熵的公式：

通常情况下对数以2为底或以e（自然对数）为底，并且我们规定如果pi=0则定义0log0=0。

一个服从两点分布的随机变量的信息熵图像如下图所示：

可以知道，当信息熵趋近于0.5的时候。所得出的信息熵最大。表示了函数的混乱程度很高。即某一个变量产生结果的的概率是0.5，不产生结果的概率的也是0.5 所以这个变量并不是可以衡量最后特征的重要取值。

Gini 函数：<

最低0.47元/天解锁文章

孟德尔的豆豆

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
算法-决策树（分类算法）

决策树算法（DecisionTree）决策树是机器学习中常用的分类算法决策树顾名思义是一种树形结构，而我们的任务就是想办法构建出这样一颗树用它来进行分类。构建过程：1. 选择一个对象的特征，并根据这一训练集进行分类2.计算某特征分类结果的混乱程度（对于对混乱结果的情况评估，使用了的以下方法）信息熵：信息熵就是用来衡量一个随机变量取值的不确定性的一个指标，信息熵越大则不确定性越大，信息熵越小则不确定性也就越小。信息熵的公式：通常情况下对数以2为底或以e（自然对数）为底，并且我们规定如果p
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。