决策树

一 决策树介绍

决策树是一种基本的分类与回归方法。

决策树模型呈树形结构,在分类问题中,表示基于特征对实例进行分类的过程。可以认为是if-then规则集合。

决策树学习通常包含3个步骤:特征选择、决策树生成、决策树剪枝 

二 决策树学习过程

1、特征选择

特征选择在于选取对训练数据具有分类能力的特征。特征选择的三个方法

(1)信息增益

缺点:类别做的特征的信息增益会更大,故会偏向于选择类别较多的特征,伊日惠容易产生过拟合的问题

(2)信息增益率

在信息增益基础上产生的方法。校正了信息增益的缺点。每个特征的信息增益/该特征的信息熵

(3)基尼系数

2、决策树生成算法

(1)ID3

算法原理:选用信息增益来进行特征选择,递归的构建决策树。

缺点:(1)容易产生过拟合;(2)不能处理连续变变量

应用:分类问题

(2)C4.5 

算法原理:选用信息增益率来进行特征选择,地柜构建特征树。

解决了ID3的缺点问题(可以处理连续变变量)

应用:分类问题

(3)CART

算法原理:采用吉尼斯相互进行特征算则,地柜构建特征树

应用:分类与回归问题均可

3、决策树剪枝

一般通过极小化决策树整体的损失函数或者代价函数来实现

 

书籍《统计学习方法》

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值