基于决策树的分类算法

背景:个人对挖掘算法不太了解,学习过程中看到有C4.5算法、CART算法等,看起来都是一样的决策树,不知其区别,所以网络上搜索学习,备忘如下:
 
从决策树开始介绍,该博文不错: 算法杂货铺——分类算法之决策树(Decision tree)
 
决策树在决策过程中,选择根节点属性的度量方法(分裂规则)有多种,一般使用自顶向下递归分治法,并采用不回溯的贪心算法;
我们看到的各种决策树算法,其实主要是因为采用的度量方式的不同而得到的。
下面介绍基于不同的度量方法的三种算法;
     信息增益越大越好(ID3算法)、信息增益率越大越好(C4.5算法)、Gini增益越大越好(CART算法)
 
首先需要了解下信息熵、信息增益的概念,因为度量方法是基于此的;请见: 信息熵(Entropy)、信息增益(Information Gain) 
这些算法基于 奥卡姆剃刀原理(若无必要,勿增实体),即越是小型的决策树越优于大的决策树;
 
ID3算法请见: 归纳决策树ID3(Java实现)
CART算法请见: CART算法简介


--------------------
CART 分类回归树Classification and Regreesion Tree

转载于:https://www.cnblogs.com/liyuxia713/p/3573982.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值