人工智能教程 - 专业选修课程4.3.11 - 复杂结构数据挖掘 3.关联规则,频繁项集

关联规则探索

目标:确定同时购买的几样物品
方法:处理通过以下渠道收集的销售数据
  • 条形码扫描仪以查找依赖关系

经典法则:

  • 如果有人购买尿布和牛奶,那么他/她就可能买啤酒
  • 如果在尿布旁边发现六包,不要感到惊讶!
    在这里插入图片描述

定义

频繁项集 frequent itemsets
关联规则 Association rules::信心,支持,兴趣

用于查找频繁项集 frequent itemsets的算法

在这里插入图片描述

寻找频繁的对 Finding frequent pairs
  • A-Priori算法
  • PCY算法
    在这里插入图片描述
    为了减少规则数量,我们可以 对它们进行后处理,仅输出:
  • 最大频繁项集: Maximal frequent itemsets:
    没有立即的超集是频繁的
    • 提供更多修剪 pruning

或者

  • 封闭项目集:
    没有立即超集具有相同的支持(> 0)
    • 不仅存储频繁的信息,而且存储准确的信息
      支持/计数

对于许多频繁项集算法,主内存main-memory是关键资源

  • 阅读篮子时,我们需要数数,例如,成对物品的出现
  • 我们可以计算的不同事物的数量受主内存限制
  • 交换数进/出是一场灾难

频繁对的两种方式

在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值