数据挖掘与数据仓库——关联规则挖掘

关联规则挖掘

基本概念

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

Apriori算法

Apriori裁剪原理: 对于任意项集,如果它不是频繁集,则它的任何超集不用产生/测试!
算法流程:

在这里插入图片描述

关于连接操作:

在这里插入图片描述

一个例子:

在这里插入图片描述

Apriori算法存在问题:

  1. 多次扫描数据库
  2. 产生大量的候选集合

FP-Tree算法

可以参考:https://blog.csdn.net/kisslotus/article/details/80328045

FP-tree 算法的优点

  1. FP-tree 算法只需对事务数据库进行二次扫描;
  2. 避免产生大量候选集;

FP-tree 算法的缺点

  1. 要递归生成条件数据库和条件 FP-tree,所以内存开销大;
  2. 只能用于挖掘单维的布尔关联规则;

多维关联规则挖掘

多维关联规则:规则中有两个以上的谓词。
例如:
Age(X, “30到40”)∧Income(X, “4万-6万”)→ Buys(X, “computer”)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值