php关联规则,arules:关联规则及可视化

最新推荐文章于 2024-03-10 08:56:48 发布

小旅兔

最新推荐文章于 2024-03-10 08:56:48 发布

阅读量266

点赞数

文章标签： php关联规则

在个性化推荐中，除了应用比较广的协同过滤，还有关联规则。作为数据挖掘中一个独立的课题，关联规则用于从大量数据中挖掘出有价值的数据项之间的相

关关系，比如购买啤酒的顾客有多大的概率购买尿布？这就购物篮中比较著名的”啤酒与尿布“的故事；介绍两个关联规则中常用的算法：Apriori和

Eclat，这两个算法在arules中均有涉及；

Apriori算法是应用比较广泛的频繁项集的算法，特别是挖掘布尔关联规则(0-1)；算法主要分为两步：第一步通过迭代，检索出事务交易数据中的所有频繁项集，即支持度不低于用户设定的阈值的项集；

第二步利用频繁项集构造出满足用户最小信任度的规则。其中，挖掘或识别出所有频繁项集是该算法的核心，占整个计算量的大部分。

Eclat主要思想是倒排，常规的交易数据是事务ID-事务数据，Eclat用事务中的每一项作为ID，事务ID作为值，对交易数据进行了变换；

arules package

QQ%E6%88%AA%E5%9B%BE20130816101557.jpg

从上图可见：关联规则的核心是生成itemMatrix，然后由apriori算法生成规则或者由eclat算法生成频繁项集；

介绍一下arules中常用的函数：

一个arules的例子：

itemFrequencyPlot:

简单介绍一下关联规则的可视化包：

chart.1：Two-key plot

chart.2：Grouped matrix for 232 rules

chart.3：Graph plot

参考资料：

[3] 维基百科：关联规则

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
php关联规则,arules:关联规则及可视化

在个性化推荐中，除了应用比较广的协同过滤，还有关联规则。作为数据挖掘中一个独立的课题，关联规则用于从大量数据中挖掘出有价值的数据项之间的相关关系，比如购买啤酒的顾客有多大的概率购买尿布？这就购物篮中比较著名的”啤酒与尿布“的故事；介绍两个关联规则中常用的算法：Apriori和Eclat，这两个算法在arules中均有涉及；Apriori算法是应用比较广泛的频繁项集的算法，特别是挖掘布尔关联规则(0...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。