Apriori算法

本文介绍了关联规则的基本概念,如项、项集、支持度、最小支持度、置信度和提升度。通过实例展示了如何从交易记录中找出频繁项集,并基于这些频繁项集构建满足最小信任度的规则。算法步骤包括迭代寻找频繁项集和构造关联规则。
摘要由CSDN通过智能技术生成

1、关联规则

项:数据库中不可分割的最小单位信息

项集:项的集合,设集合I={i1,.....ik} ,I 中项目个数为k,集合称为k-项集

2、支持度、最小支持度、置信度

假设A中有N条数据

支持度:表示项集在整个A中的频率,Support=sum(x)/N

最小支持度:阈值参数,支持度≥最小支持度的项集称为频繁项集

置信度:表示规则X---->Y,即在X发生条件下,Y发生的概率

confidence=support(xUy) / support(x)

3、提升度

判断X---->Y中的X与Y是否独立,如果独立 该规则是无效的

Lift(X---->Y) = support(xUy) / support(x)*support(y) =confidence(X---->Y) / support(y)

若值=1,独立; 值<1 ,负相关; 值>1 正相关

4、算法步骤:

(1)通过迭代,找出所有的频繁项集(支持度大于最小支持度)

(为了找Lk,通过将Lk-1与自身连接,产生k项集)

(2)利用频繁项集构造出满足用户最小信任度的规则

5、例子:

现有A、B、C、D、E,5种物品的4条交易记录,找出3种物品的关联情况。最小支持度为50%

A、C、D

B、C、E

A、B、C、E

B、E

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值