R语言|关联规则挖掘|可视化

最新推荐文章于 2024-07-23 15:14:02 发布

Running_you

最新推荐文章于 2024-07-23 15:14:02 发布

阅读量1.3w

点赞数 8

分类专栏： R语言可视化文章标签： r语言可视化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sinat_29508201/article/details/52039306

版权

本文介绍了如何使用R语言进行关联规则挖掘，重点在arules和arulesViz包的应用。首先，通过read.transactions函数加载数据并创建稀疏矩阵，接着筛选交易数据并使用itemFrequencyPlot进行支持度可视化。接着，运用apriori算法挖掘规则，并通过sort和subset函数进行规则排序和筛选。最后，探讨了规则的评价方法和可视化展示，包括scatterplot、grouped等不同类型的图形。

摘要由CSDN通过智能技术生成

为了进一步巩固R语言的基本用法及实践场景，这里尝试利用R做一些在关联规则上的挖掘实践，这里首要感谢博主gjwang1983的文章，这里仅记录下学习的一些基本应用命令：

1.工具包的选取
规则挖掘包arules
规则可视化包arulesViz
2.数据源选取加载
源数据：groceries 数据集，每一行代表一笔交易所购买的产品（item），形如：
```
citrus fruit,semi-finished bread,margarine,ready soups
tropical fruit,yogurt,coffee
whole milk
pip fruit,yogurt,cream cheese,meat spreads
other vegetables,whole milk,condensed milk,long life bakery product
whole milk,butter,yogurt,rice,abrasive cleaner
rolls/buns
other vegetables,UHT-milk,rolls/buns,bottled beer,liquor (appetizer)
potted plants
whole milk,cereals
tropical fruit,other vegetables,white bread,bottled water,chocolate
......
```
数据转换：创建稀疏矩阵，每个Item一列，每一行代表一个transaction。1表示该transaction购买了该item，0表示没有购买。当然，data frame是比较直观的一种数据结构，但是一旦item比较多的时候，这个data frame的大多数单元格的值为0，大量浪费内存。所以，R引入了特殊设计的稀疏矩阵，仅存1，节省内存。arules包的函数read.transactions可以读入源数据并创建稀疏矩阵。

groceries <- read.transactions(“groceries.csv”, format=”basket”, sep=”,”)
3.数据查看与筛选

最低0.47元/天解锁文章

关注

8
点赞
踩
68

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。