决策树-ID3算法和C4.5算法

  决策树是一种有监督(现有样本已知分类结果)的机器学习方法。它通过对已有样本的学习生成一颗决策树(可看成if-then规则集合),从而能对新样本作出相应分类。本文重点阐述如何选择特征建立决策树,并给出理解算法的具体实例。
  
  


  
  

一、什么是决策树

  
决策树:通过对已知样本的学习,一步一步将特征进行分类,从而将整个特征空间进行划分,进而区分出不同类别的算法。我们在逻辑判断中用到的思想if, else if ,else, then,其实就是决策树的思想。只是用哪个条件特征先做if,哪个条件后做if得到的结果会比较好呢?1970年,一名叫昆兰的大牛采用了信息论中的熵来度量最优特征选择。昆兰把这个算法称为ID3算法。该算法一出,它的简洁和高效就引起了轰动。
  
接下来我们详细介绍ID3算法。

  
  

二、ID3算法详解

  

1 什么是熵

  
熵度量了事物的不确定性,越不确定的事物,熵越大。随机变量X的熵公式如下:
  
在这里插入图片描述

  
其中n表示随机变量X的n种不同离散取值,pi表示X取值为i的概率,log表示以2为底或以e为底的对数。
  
假设随机变量X表示掷

  • 3
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

阿黎逸阳

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值