决策树分类算法

最新推荐文章于 2022-02-01 16:03:12 发布

oucpowerman

最新推荐文章于 2022-02-01 16:03:12 发布

阅读量1.4k

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/oucpowerman/article/details/50276911

版权

本文介绍了决策树模型，包括内部结点和叶子节点的概念，并解释了如何将其视为一系列的“if-then”规则。接着，文章阐述了决策树学习过程，涉及到特征选择、决策树生成和剪枝，以防止过拟合。特征选择通过信息增益和信息增益比来衡量，ID3和C4.5算法分别基于这两个指标。最后，讨论了ID3算法的构建步骤，并提到了决策树可能面临的过拟合问题及解决方案。

摘要由CSDN通过智能技术生成

一、决策树模型

决策树是一种对实例进行分类的树形结构，由结点（node）、有向边（directed edge）组成。

结点有2种类型：内部结点和叶子节点，其中内部结点表示实例样本的一个特征（feature），叶子

节点表示实例的类别（class）。一颗典型的决策树如下图所示：

可以将决策树看成是一个“if-then”规则的集合，决策树的每条路径就是一条规则，路径上的内

部节点表示样本的特征，有向边表示对特征的判断条件，最后的叶子节点表示样本的类别。

二、决策树学习

决策树学习本质上是从训练样本集中归纳出一组分类规则，我们需要得到一个与训练数据差别

最小、泛化能力强的决策树模型。决策树学习通常是一个递归的选择最优特征，并根据该特征对训

练数据集进行分割，使得对各个子数据集有最好分类的一个过程。这种方法虽然对训练数据有很好

的分类能力，但是对未知的测试数据却未必会有很好的分类能力，可能会发生过拟合现象。为了抑

制过拟合，需要对生成的决策树进行“剪枝”，使得树变得更简单，使其具有更好的泛化能力。

如果特征过多，也可以在决策树学习开始的时候，对特征进行选择，只留下对训练数据有很好

的分类能力的特征。特征选择是特征工程的重要问题（特征选择+特征提取）。

可以看出，决策树学习包括：特征选择、生成决策树、剪枝这3步。目前常用的学习算法有ID3

、C4.5（或C5.0）。

三、特征选择

特征选择，是选取对训练数据有较好分类能力的特征，这样可以提高机器学习的效率。如果用

一个特征进行分类的结果与随机分类的结果没有很大差别，则称这个特征没有分类能力，扔掉这些

特征对分类没有影响，最终只保留有分类能力的特征。特征选择的准则通常是：信息增益或信息增

益比。

1、熵

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

oucpowerman CSDN认证博客专家 CSDN认证企业博客

码龄9年

9: 原创

111万+: 周排名

149万+: 总排名

10万+: 访问

: 等级

784: 积分

30: 粉丝

41: 获赞

18: 评论

130: 收藏

私信

关注

热门文章

分类专栏

最新评论

Logistic回归分析时几个需要注意的问题
野柚子__: 同问。感觉没有办法处理，因为原始数据就是这样？或者试试把不同的组合并？
Logistic回归分析时几个需要注意的问题
m0_55294147: 感谢！如果出现了“空单元格”或“完全分离”的情况，应该如何处理该变量呢？前提是样本量已经无法继续扩大了，谢谢！！！
矩阵分解模型（1）：ALS学习算法
qq_42798324 回复 jiangnangogogo: 我看了代码，个人觉得是只有已经评分过的商品才有损失函数。
矩阵分解模型（1）：ALS学习算法
ET_Wangxing: 公式这边显示不了楼主~
矩阵分解模型（1）：ALS学习算法
jiangnangogogo: 楼主你好，由于原始的评分矩阵里面并不是所有的值都存在，那么在后面进行als的时候，由于要进行评分值减去ui和vj的乘积这个操作，请问对于缺失的评分值怎么处理呢？填0 吗？还是说直接不参与运算？看到下面有一条评论问了相同的问题，然后有人答复说赋予随机数，请问这里可以只选取存在的aij进行计算吗？当然这样操作的话可能会导致有的ui 和 vj估计不出来

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。