关联规则算法总结

目的:两个属性是否相关联的研究

物品集I里面是物品,事务集

事务T支持物品集A:这个事务中包含此物品

支持度

物品A的支持度:1000个顾客购物,200个买了面包,支持度20%(200/1000)

关联规则A->B的支持度(联合概率):1000个顾客购物,100个购买了面包和黄油。则面包->黄油 10%

可信度

关联规则A->B的可信度(条件概率):1000个顾客购物,200个购买了面包,140个购买了面包和黄油,则可信度为70%(140/200)

A->B的支持度和B->A的支持度一样,可信度不同。

规则度量

最小支持度minsup关联规则必须满足的最小支持度

最小可信度minconf关联规则必须满足的最小可信度

大项集

频繁项集:支持度不小于minsup的物品集

最大频繁项目集:频繁集中挑选出所有不被其他元素包含的平凡项目集。

关联规则发现任务

事务数据库D,满足最小支持度和最小可信度的关联规则

1)求D中满足最小支持度的所有频繁集(Apriori算法和FP树都是找频繁集的算法)。大于支持度

2)利用频繁集生成满足最小可信度的所有关联规则。大于可信度

高效求出频繁集:生成长度为1的L[1];L[k]的基础上生成候选物品集C[k+1],候选物品集必须保证包括所有的频繁项集。

  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值