数据挖掘学习笔记:关联规则3

ARCS过程中的步骤包括

  1. 分箱(根据不同分箱方法创建一个2-D数组),本步骤的目的在于减少量化属性相对应的巨大的值个数,使得2-D栅格的大小可控
    • 等宽分箱
    • 等深分箱
    • 基于同质的分箱
  2. 找出频繁谓词集
    • 扫描分箱后形成的2-D数组, 找出满足最小支持度和置信度的频繁谓词集
      这里写图片描述

ARCS的局限性

  • 所挖掘的关联规则左手边只能是量化属性
  • 规则的左手边只能有两个量化属性(2-D栅格的限制)
  • 一种基于栅格的, 可以发现更一般关联规则的技术, 其中任意个数的量化属性和分类属性可以出现在规则的两端

    1. 等深分箱动态划分
    2. 根据部分完全性的度量进行聚类

    挖掘基于距离的关联规则

    这里写图片描述

关联规则的兴趣度度量

  1. 客观度量
    • 两个流行的度量指标
    • -支持度
    • -置信度
  2. 主观度量
  3. 挖掘了关联规则后, 哪些规则使用户感兴趣的? 强关联规则是否就是有趣的?

对强关联规则的批评

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值