十七、Apriori算法原理

本文详细介绍了关联规则学习中的Apriori算法,包括支持度、置信度和提升度的概念。支持度衡量商品组合出现的频率,置信度表示购买商品A后购买商品B的概率,而提升度则反映商品A对商品B出现概率的提升程度。通过Apriori算法,可以找到频繁项集,即支持度超过预设阈值的商品组合。文章以实例展示了如何逐步筛选频繁项集,最终得到满足条件的频繁项集。
摘要由CSDN通过智能技术生成

支持度、置信度和提升度

支持度:是个百分比,指的是某个商品组合出现的次数与总次数之间的比例。支持度越高,代表这个组合出现的频率越大

置信度:是个条件概念,指的是当你购买了商品A,会有多大的概率购买商品B

提升度:商品A的出现,对商品B的出现概率提升的程度,商品A的出现,对商品B的出现概率提升的程度
提升度(A→B)=置信度(A→B)/支持度(B)

  • 提升度(A→B)>1:代表有提升;
  • 提升度(A→B)=1:代表有没有提升,也没有下降;
  • 提升度(A→B)<1:代表有下降。

Apriori算法原理

这里有1-6个商品:
在这里插入图片描述

Apriori算法就是查找频繁项集(frequent itemset)的过程
频繁项集:支持度大于等于最小支持度(Min Support)阈值的项集。
非频繁项集:支持度小于最小支持度的项集

假设最小支持度为0.5,以下K为商品组合个数

1、先计算K=1的支持度

在这里插入图片描述
那么Item4和6不符合最小支持度的,不属于频繁项集:
在这里插入图片描述

2、k=2项的支持度:

在这里插入图片描述
筛选掉小于最小值支持度的商品组合:
在这里插入图片描述

3、K=3项的支持度

在这里插入图片描述

筛选掉小于最小值支持度的商品组合:
在这里插入图片描述
得到K=3项的频繁项集{1,2,3}

Apriori算法的流程:

Step1,K=1,计算K项集的支持度;
Step2,筛选掉小于最小支持度的项集;
Step3,如果项集为空,则对应K-1项集的结果为最终结果。
否则K=K+1,重复1-3步。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值