决策树 学习提纲(需要解决的一些问题)

之前以为决策树挺简单的,之前看了西瓜树感觉自己对决策树了解了,但是现在感觉还是很多问题啊。列出一下提纲(基本都是问题)

决策树是一种基本的分类与回归的方法,使用中应该是用于分类的比较多,但是像CART也可以用于回归。

 

决策树的算法,我学的就三个:ID3、C4.5、CART,主要分为树的生成和剪枝。

 

在树的生成过程中的一个大的问题就是数据值的处理和分割点的选择。

分割点的选择依据有信息增益和信息增益比。

数值处理:连续值的处理,缺失值的处理

 

信息增益的计算方法。

 

信息增益与信息增益比的对比。信息增益在划分数据集时候存在偏向于选择值比较多的特征的问题,使用信息熵增益比可以对这一问题进行矫正。

 

转载于:https://www.cnblogs.com/earendil/p/8544248.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值