决策树学习

在第二波人工智能中,主要研究专家系统,决策树在专家系统中被广泛使用。
流行的决策书算法有,ID3、C4.5(由ID3的作者改进而来)、CART(分类回归树,即既可以作分类,也可以做回归),这些算法的建树过程基本相似,都是从根节点开始向下分裂,所不同是选取的分裂特征和阈值的方法有所不同。
选择方法:
ID3:信息增益最大(对标签Y提供信息最多的特征),倾向于选择取值多的特征进行分裂。
C4.5:ID3的改进,信息增益率最大
CART:分类:GINI指数最大
回归:军方误差最小(也就是L2损失最小)
我们希望分裂后的节点所包含样本的类别相同,这样新样本来的时候就可以定位到某个节点,就可以判断为这个节点对应的类别。ID3分裂方式是在所有特征中选取能使信息增益最大的特征来进行分裂。特质选取后,每一个特质值分裂为一个下级节点,该节点就在父节点样本的范围内,拥有所有为该特征值的样本。
信息增益计算方式:
令当前节点的样本集合为D
计算样本标签值为c的概率: p ( Y = c ) = π c = 1 ∣ D ∣ ∑ i ∈ D ⨿ ( y i = c ) p(Y=c) = \pi_{c} = \frac{1}{\begin{vmatrix}D\end{vmatrix} } \sum _{i \in D}\amalg(y_{i}=c) p(Y=c)=πc= D 1iD⨿(yi=c) 其中 ⨿ 为示性函数,条件满足函数值为 1 ,不满足为 0 其中\amalg为示性函数,条件满足函数值为1,不满足为0 其中⨿为示性函数,条件满足函数值为1,不满足为0

  • 5
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值