人工智能算法—决策树

最新推荐文章于 2024-07-31 11:26:32 发布

soso_blog

最新推荐文章于 2024-07-31 11:26:32 发布

阅读量3w

点赞数

分类专栏：技术分享文章标签：算法 branch function float tree python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/soso_blog/article/details/5755457

版权

本文介绍了决策树的基本原理，包括熵和基尼不纯度两种衡量集合纯度的方法，并提供了Python实现。通过示例展示了如何构建和利用决策树进行分类。最后，讨论了决策树在实际应用中的挑战和适用场景。

摘要由CSDN通过智能技术生成

文/腾讯soso 林世飞

决策树方法最早产生于上世纪60年代，到70年代末。由J Ross Quinlan提出了ID3算法，此算法的目的在于减少树的深度。但是忽略了叶子数目的研究。C4.5算法在ID3算法的基础上进行了改进，对于预测变量的缺值处理、剪枝技术、派生规则等方面作了较大改进，既适合于分类问题，又适合于回归问题

这里介绍其基本原理和一个实验例子。

先介绍2个算法：

算法一：熵（entropy）

熵（entropy）指的是体系的混乱的程度，当我们尝试把混合集合A={B1,B2,C1,C2…..} （其中Bx表示一个类别的元素，Cx表示另外一个）划分为2个集合 M、N（即决策树的2个分支时候），比较好的划分是 M 里面都是 Bx，N里面都是Cx，这时候我们需要一个函数对划分以后的集合进行评估，看看是否纯度够“纯”。如果很纯，很有序，熵就是0.

理解该公式： p(xi) 越平均，系统约混乱，如果系统只有2个元素x1、x2，x1出现概率是0.5，x2出现概率也是0.5，即p(x1) =0.5 p(x2) =0.5 ，这时公式计算结果为1； p(xi)如果比较不平均，比如p(x2) =1，那就是系统很确定，一点都不混乱，肯定是x2构成，这时熵计算结果就是0.

这个规律刚刚好是 log 函数特点过（1，0）这个点（见下图），我想这个就是克劳德·艾尔伍德·香农设计这个公式选择log函数的道理。

用python 实现就是：

def entropy(l):

from math import log

#函数编程语法，定义一个函数

log2=lambda x:log(x)/log(2)

total=len(l)

counts={}

#统计每个类型出现格式

for item in l:

counts.setdefault(item,0)

counts[item]+=1

ent=0

for i in counts:

p=float(counts[i])/total #计算概率

ent-=p*log2(p) #熵计算

return ent

算法二：除了熵，还有一个衡量一个集合是否混乱的方法叫 Gini Impurity （基尼不纯度）方法。

公式如下：

最低0.47元/天解锁文章

关注

0
点赞
踩
162

收藏

觉得还不错? 一键收藏
29
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

soso_blog CSDN认证博客专家 CSDN认证企业博客

码龄14年

29: 原创

104万+: 周排名

126万+: 总排名

41万+: 访问

: 等级

4237: 积分

399: 粉丝

6: 获赞

693: 评论

30: 收藏

私信

关注

热门文章

分类专栏

最新评论

腾讯soso技术专家系列之总经理孙良
一座青山: 为啥后续不更新文章了呢？
关于go语言
飞飞好奇: 文章不错
关于go语言
wenjin_gu: 请教一下：cgo是否支持回调？如果不支持的话，该如何实现回调功能呢？
腾讯搜搜孙良：“情境搜索”更懂你
xuanxuan134: 顶楼上！
关于go语言
xuanxuan134: equipment, metallurgical, building materials and other industries. Far do not say, take the city development now, the subway, the viaduct, and public buildings, in this new city, all the construction without the support of the crusher. And this year to deeply launch the construction of urbanization and the development of China's west, mining development in the western area of our country and also quickly, there are a lot of large mining of mineral resources and has not yet, will provide a larger market for machinery industry, at the same time increase the crusher the demand of the market. <a href="http://www.crusherproduct.net/grinding.html">grinding mill</a>

大家在看

最新文章

目录

评论 29

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。