决策树模型

        决策树采用树结构来进行决策的,可以认为是if-then规则集合,也可以认为是对特征空间划分,每个子空间对应一个输出。其优点简单,快速,可解释性强。决策树通常包含三部分:特征选择,决策树生成,决策树剪枝。

1.特征选择

    信息增益,信息增益比,基尼指数是常用的特征选择准则

  • 信息增益

      信息熵:表示变量的不确定程度,信息熵越大不确定却大。也可说是样本纯度,样本纯度越高,信息熵越小

                                       Ent(D)=-\sum_{y=1}^{|y|}p_ylog_2 p_y

     信息增益:给定特征后不确定性减少程度

                                    Gain(D,a)=Ent(D)-\sum_{v=1}^V \frac{|D_v|}{|D|}Ent(D_v)

  • 信息增益比

                                   

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值