决策树算法

本文详细介绍了决策树算法,包括ID3、C4.5和CART三种常见决策树模型。通过信息熵、信息增益、信息增益比和基尼指数等概念,阐述了特征选择和树生成的过程。同时,探讨了CART算法在分类和回归问题中的应用,以及过拟合问题。
摘要由CSDN通过智能技术生成

决策树

决策树(Decision Tree)首先对数据进行处理,利用归纳算法生成可读的规则和决策树,然后使用决策对新数据进行分析,本质上是通过一系列规则对数据进行分类的过程

决策树是一种典型的分类方法。其中:

  • 每个内部结点表示一个属性上的判断
  • 每个分支代表一个判断结果的输出
  • 每个叶结点代表一种分类结果。

CLS算法是早期提出的决策树学习算法,是很多决策树学习算法的基础框架。
依据其中选择分类属性的策略不同,可以得到不同的决策树算法。比较常用的决策树有ID3,C4.5和CART三种和实现,其中CART一般优于其他决策树,并且可用于回归任务。

下面我们将编写代码实现这三种决策树算法。

导入包和创建数据集

本实验所需的包不多

  • log用于计算
  • treePlotter为已经编写好的用于可视化决策树的代码,createPlot(tree)就可以调用
  • csv为对csv文件进行操作所需的包

本实验第一个使用的是天气情况数据集,属性集合A={ 天气,温度,湿度,风速}, 类别标签有两个,类别集合L={进行(yes),取消(no)}。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

取个名字真难啊啊

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值