R语言|关联规则挖掘|可视化

本文介绍了如何使用R语言进行关联规则挖掘,重点在arules和arulesViz包的应用。首先,通过read.transactions函数加载数据并创建稀疏矩阵,接着筛选交易数据并使用itemFrequencyPlot进行支持度可视化。接着,运用apriori算法挖掘规则,并通过sort和subset函数进行规则排序和筛选。最后,探讨了规则的评价方法和可视化展示,包括scatterplot、grouped等不同类型的图形。
摘要由CSDN通过智能技术生成

为了进一步巩固R语言的基本用法及实践场景,这里尝试利用R做一些在关联规则上的挖掘实践,这里首要感谢博主gjwang1983的文章,这里仅记录下学习的一些基本应用命令:

  • 1.工具包的选取
    规则挖掘包arules
    规则可视化包arulesViz

  • 2.数据源选取加载
    源数据:groceries 数据集,每一行代表一笔交易所购买的产品(item),形如:

    citrus fruit,semi-finished bread,margarine,ready soups
    tropical fruit,yogurt,coffee
    whole milk
    pip fruit,yogurt,cream cheese,meat spreads
    other vegetables,whole milk,condensed milk,long life bakery product
    whole milk,butter,yogurt,rice,abrasive cleaner
    rolls/buns
    other vegetables,UHT-milk,rolls/buns,bottled beer,liquor (appetizer)
    potted plants
    whole milk,cereals
    tropical fruit,other vegetables,white bread,bottled water,chocolate
    ......

    数据转换:创建稀疏矩阵,每个Item一列,每一行代表一个transaction。1表示该transaction购买了该item,0表示没有购买。当然,data frame是比较直观的一种数据结构,但是一旦item比较多的时候,这个data frame的大多数单元格的值为0,大量浪费内存。所以,R引入了特殊设计的稀疏矩阵,仅存1,节省内存。arules包的函数read.transactions可以读入源数据并创建稀疏矩阵。

    groceries <- read.transactions(“groceries.csv”, format=”basket”, sep=”,”)

  • 3.数据查看与筛选

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值