决策树学习算法——ID3,C4.5,CART详解

一、决策树

决策树的学习过程包括三个步骤:

a)特征选择。不同的特征和预测目标具有不同强度的相关性,选择相关性最强的特征能够有效提高预测效果。

b)节点分裂。训练集会在决策树中按照节点规则分流,如果 节点A 没办法给出一个满意的分类结果,那它就会选择分裂,分成 2 个或者多个节点。那么根据什么分裂呢?节点A 会用熵来判断用哪个特征分裂是最优的。

c)剪枝。决策树不加限制地分裂容易产生过拟合现象,剪枝可以一定程度地缓解过拟合,提高泛化能力。

决策树的学习算法有多种,常用的有:ID3,C4.5,CART。下面逐个介绍

1、ID3

前言

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

1.1计算公式

在这里插入图片描述

1.2例子

以如下样本为例:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
当我们最左侧的纹理清晰的子集D1进行第二次分裂时,可以计算D1的信息熵:
7好2坏
7好2坏
在这里插入图片描述
此时对于 D1 子集的触感属性进行属性不同取值区间的信息熵计算得出,当触感硬滑时:
6好0坏

  • 17
    点赞
  • 69
    收藏
    觉得还不错? 一键收藏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值