机器学习2:决策树--基于信息增益的ID3算法

1.决策树的简介

 

建立决策树的过程可以分为以下几个步骤:

  1. 计算每个特征的信息增益或信息增益比,选择最优的特征作为当前节点的划分标准。
  2. 根据选择的特征将数据集划分为不同的子集。
  3. 对每个子集递归执行步骤 1 和步骤 2,直到满足终止条件。
  4. 构建决策树,并输出。

基于信息增益的ID3算法;

ID3算法:

  1. 计算每个特征的信息增益。信息增益 = H(D) - H(D|A),其中H(D)是样本的熵,H(D|A)是在特征A给定的条件下样本的条件熵。
  2. 选择信息增益最大的特征作为当前节点的划分标准。
  3. 对每个特征值创建一个子节点,并递归地执行步骤 1 和步骤 2。

(1)信息熵的计算

案例1

案例2

(2)信息增益 Gain

 

案例1 

 

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值