2021-10-12 《数据挖掘-实用机器学习工具与技术》—— 学习笔记 第三章 输出: 知识表达

本文介绍了知识表达的不同形式,包括决策表、线性回归模型、决策树、规则学习以及基于实例的学习。线性模型用于数值预测和分类,而决策树在回归任务中使用。规则学习涉及分类规则、关联规则和基于例外的规则,更复杂的表达则通过归纳逻辑编程实现。基于实例的学习,如k-近邻法,依赖于样本实例。此外,聚类用于组织数据,可使用维恩图展示。
摘要由CSDN通过智能技术生成
第三章 输出: 知识表达
3.1 表 (决策表)
3.2 线性模型
  • 回归:预测数值型变化的过程
  • 可用来回归预测,也可用来分类。(高维空间是超平面)
3.3 树
  • 在叶子节点上包含平均数值型值得决策树称为回归树
3.4 规则
  • 分类规则

    将规则转换成决策树时,

  • 关联规则
    在这里插入图片描述

  • 包含例外的规则

    从逻辑上,基于例外的规则可以简单地用if…then…else语句改写。

  • 表达能力更强的规则

    归纳逻辑编程 inductive logic programming

3.5 基于实例的表达(instance-based learning)
  • 保存实例本身,将类未知的新实例与现有类已知的实例联系起来进行操作
  • 直接在样本上工作,而不是推断出规则集和决策树。
  • 基于实例的学习是懒惰的,尽可能延缓实质性的工作。
  • 最近邻分类方法、k-近邻法(k-nearest-neighbor),欧几里得距离,所有属性被规范化。
  • 名目属性(如颜色红、黄、蓝标签类),怎么表达距离?
  • 属性重要性:加权 ,从训练集上获得合适的属性权值;
  • 没有必要保留所有的训练实例:
    • 实例过多计算缓慢、占用存储空间
  • 不能对所学到的知识给出一个清晰的数据结构
3.6 聚类
  • 输出采用一个显示实例如何落入聚类的图形形式;
  • 有些聚类算法允许一个实例可以属于多个聚类,维恩图(Venn diagram)etc;
    在这里插入图片描述
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值