【数据挖掘】关联分析之Apriori

47 篇文章 10 订阅 ¥19.90 ¥99.00
Apriori算法是一种用于关联分析的方法,旨在找出数据集中频繁出现的项集和高置信度的规则。它通过支持度和置信度来衡量规则的有效性,并避免了暴力搜索的高计算成本。在购物篮问题中,Apriori算法可以发现如{'尿布'}→{'啤酒'}这样的关联规则。文章提到Apriori在某些数据集上的运行速度较慢,需要进一步优化。参考文献包括《machine learning in action》和《Introduction to data mining》。
摘要由CSDN通过智能技术生成

1.Apriori算法


如果一个事务中有X,则该事务中则很有可能有Y,写成关联规则

{X}→{Y}

将这种找出项目之间联系的方法叫做关联分析。关联分析中最有名的问题是购物蓝问题,在超市购物时,有一个奇特的现象——顾客在买完尿布之后通常会买啤酒,即{尿布}→{啤酒}。原来,妻子嘱咐丈夫回家的时候记得给孩子买尿布,丈夫买完尿布后通常会买自己喜欢的啤酒。


考虑到规则的合理性,引入了两个度量:支持度(support)、置信度(confidence),定义如下

评论 10
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

浅唱书令

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值