第四章(1) 分类:决策树

  1. 分类任务就是确定对象属于哪个预定义的目标类
  2. 分类的属性集可以包含连续属性,但类标号必须是离散的,这是分类与回归的区别,回归的目标属性y是连续的
  3. 分类任务就是通过学习得到一个目标函数(分类模型),把属性集x映射到一个预先定义的类标号y
  4. 分类模型可以作为解释性工具,区分不同类中的对象;预测未知记录的类标号
  5. 分类技术适合二元或标称的数据集,不适用于序数或包含关系的属性
  6. 分类技术是一种根据输入数据集建立分类模型的系统方法。5种包括:决策树、基于规则的分类、神经网络、支持向量机、朴素贝叶斯分类;需要类标号已知的训练集来建立模型,用于类标号未知的检验集。
  7. 对分类模型的准确率检测是评估的关键
  8. 决策树:
    1. 决策树是一种结点和有向边组成的层次结构,三种结点:
      1. 根节点:没有入边,零条或多条出边
      2. 内部节点:有一条入边和多条出边
      3. 叶节点:一条入边,没有出边
      4. 每个叶节点有一个类标号,非叶节点包含属性测试条件
    2. 如何建立决策树:搜索空间是指数级的,找出最佳的决策树是不可行的;使用贪心算法,在划分属性时,采用一系列局部最优决策来构造决策树,Hunt算法是ID3、C4.5、CART的基础
      1. Hunt算法:Dt是与结点t相关联的数据集
        1. 如果Dt中所有记录都属于一个类,则t是叶节点
        2. 如果Dt中包含多个类,则选择一个属性测试条件,将记录划分为较小的子集,作为子女结点,对每个子女结点递归调用该算法
        3. hunt算法的实际
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值