数据挖掘实训 Week 6

理论学习1. 决策树1.1 概念每个非叶节点表示一个特征属性上的测试,每个分支代表这个特征属性在某个值域上的输出,而每个叶节点存放一个类别。优点:决策过程直观,易理解,可解释性强。1.2 构造属性是离散值且不要求生成二叉决策树,此时用属性的每一个划分作为一个分支。属性是离散值且要求生成二叉决策树,此时使用属性划分的一个子集进行测试,按照“属于此子集”和“不属于此子集”分成两个分支。属性是连续值,此时确定一个值作为分裂点split_point,按照>split_point和<
摘要由CSDN通过智能技术生成

理论学习

1. 决策树
1.1 概念
  • 每个非叶节点表示一个特征属性上的测试,每个分支代表这个特征属性在某个值域上的输出,而每个叶节点存放一个类别。
  • 优点:决策过程直观,易理解,可解释性强。
1.2 构造
  • 属性是离散值且不要求生成二叉决策树,此时用属性的每一个划分作为一个分支。
  • 属性是离散值且要求生成二叉决策树,此时使用属性划分的一个子集进行测试,按照“属于此子集”和“不属于此子集”分成两个分支。
  • 属性是连续值,此时确定一个值作为分裂点split_point,按照>split_point<=split_point生成两个分支。
1.3 不纯度衡量
  • 信息熵用来描述信源的不确定度。 H = − ∑ i = 1 n p i log ⁡ p i H=-\sum^{n}_{i=1}p_i\log{p_i} H=i=1npilogpi
  • 基尼系数: I G
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值