机器学习算法 - 频繁项集和关联规则思想

Apriori算法利用支持度的反单调性进行剪枝,寻找频繁项集。若项集非频繁,其超集也必定非频繁。算法通过计数、比较支持度并删除不满足条件的项,生成候选项集。关联规则中,若规则X->Y的置信度不满足阈值,所有X的子集形成的规则也不会满足。
摘要由CSDN通过智能技术生成

频繁项集

Apriori算法命名源于算法使用了频繁项集性质的先验(Prior)知识。
性质一:如果一个项集是频繁的,则它的所有子集一定也是频繁的;
性质二:相反,如果一个项集是非频繁的,则它的所有超集也一定是非频繁的;
这种基于支持度度量修剪指数搜索空间的策略称为基于支持度的剪枝(support-based pruning)
这种剪枝策略依赖于支持度度量的一个关键性质,即一个项集的支持度决不会超过它的子集的支持度。这个性质也称为支持度度量的反单调性(anti-monotone)

image-20210624201839803

过程

对候选项进行计数

比较与最小支持度的关系  不满足则删除

自链接和剪枝 产生候选项集		-		剪枝:如果一个项集是非频繁的,则它的所有超集也一定是非频繁的;
image-20210624201754289

上面的C3中没有{A,B,C}是因为{A,B}不为频繁项,所以子连接后要去除

相反,如果一个项集是非频繁的,则它的所有超集也一定是非频繁的;

image-20210624202247287

例子

image-20210624202454110 image-20210624202514308

关联规则

image-20210624203222591

如果规则X -> Y-X不满足置信度阈值,则形如X -> Y-X的规则一定也不满足置信度阈值,其中X*是X的子集。

例子

image-20210628181246500

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值