机器学习算法-决策树（二）

最新推荐文章于 2021-11-30 19:52:16 发布

AI_BigData_WH

最新推荐文章于 2021-11-30 19:52:16 发布

阅读量1.4k

点赞数 1

分类专栏：机器学习文章标签：机器学习算法数据挖掘决策树人工智能算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/AI_BigData_wh/article/details/77905937

版权

决策树方法最早产生于上世纪60年代，到70年代末。由J Ross Quinlan提出了ID3算法，此算法的目的在于减少树的深度。但是忽略了叶子数目的研究。C4.5算法在ID3算法的基础上进行了改进，对于预测变量的缺值处理、剪枝技术、派生规则等方面作了较大改进，既适合于分类问题，又适合于回归问题。分类与回归树CART 模型最早由Breiman 等人提出，也已经在统计领域和数据挖掘技术中普遍使用。本章将对这三种常见的决策树算法进行简单介绍。

八、信息增益选择属性-ID3

S是一个训练样本的集合，该样本中每个集合的类编号已知。每个样本为一个元组，有个属性用来判定某个训练样本的类编号。

假设S中有 $m$ 个类，总共 $s$ 个训练样本，每个类 $C_{i}$ 有 $s_{i}$ 个样本( $i＝1,2,3...m$ )，那么任意一个样本属于类 $C_{i}$ 的概率是 $s_{i} / s$ ，那么用来分类一个给定样本的期望信息是：

I (s 1, s 2, . . ., s m) = - \sum i = 1 m s i s l o g 2 s i s .

$I(s_{1},s_{2},...,s_{m} )=-\sum^{m}_{i=1}\frac{s_{i}}{s}log_{2}\frac{s_{i}}{s}.$

一个有 $v$ 个值的属性 $A=\{a_1,a_2,...,a_v\}$ 可以将S分成 $v$ 个子集{ $S_1,S_2,...,S_v$ }，其中 $S_j</script$

最低0.47元/天解锁文章

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
机器学习算法-决策树（二）

决策树方法最早产生于上世纪60年代，到70年代末。由J Ross Quinlan提出了ID3算法，此算法的目的在于减少树的深度。但是忽略了叶子数目的研究。C4.5算法在ID3算法的基础上进行了改进，对于预测变量的缺值处理、剪枝技术、派生规则等方面作了较大改进，既适合于分类问题，又适合于回归问题。分类与回归树CART 模型最早由Breiman 等人提出，也已经在统计领域和数据挖掘技术中普遍使用。
复制链接

扫一扫

专栏目录

AI_BigData_WH CSDN认证博客专家 CSDN认证企业博客

码龄7年

24: 原创

23万+: 周排名

156万+: 总排名

15万+: 访问

: 等级

1400: 积分

73: 粉丝

137: 获赞

22: 评论

477: 收藏

私信

关注

热门文章

分类专栏

最新评论

乘幂法求矩阵的特征值及特征向量
拉普拉斯～傅立叶: 如果没有n个线性无关的特征向量，这个算法不能用啊
机器学习算法-随机森林(RF)
qq_36237433: https://www.researchgate.net/publication/359157606_The_influence_of_the_neighbourhood_environment_on_peer-to-peer_accommodations_A_random_forest_regression_analysis/stats 随机森林研究案例及其代码
机器学习算法-层次聚类AGNES
lai00000: 最大距离：在簇1和簇2中各选一个点，计算两者的欧氏距离。比较所有点排列组合，选择里面最大的那个点来作为簇间距离。计算簇1和其他所有簇的簇间距离，选择最小簇间距离的簇与簇1合并。
机器学习算法-层次聚类AGNES
sug22ar: 可不可以不事先设定K值，由算法算出最合适的k值
机器学习算法-层次聚类AGNES
思考实践: 写得很好，点个赞。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。