R语言做关联分析

本文介绍了使用R语言进行关联分析的过程,通过某大型超市的购物篮数据集,展示了如何进行数据预处理,设置支持度和置信度阈值,以及运用Apriori和Eclat算法挖掘关联规则。分析结果显示,通过支持度和置信度控制,可以找到最有价值的关联规则,例如购买靴子与茄子的关联,有助于理解客户购买行为并指导市场策略。
摘要由CSDN通过智能技术生成

目录

(一)案例简介

案例使用

数据预处理

分析结果

完整代码


  目录   关联分析

理解关联分析的相关概念:关联分析、支持度、置信度、强规则、项集、频繁项集等。 掌握关联分析的基本方法:数据是事务的或关系的,如何由大量的数据中发现关联规则 ?什么样的关联规则最有趣?

 案例资料

(一)案例简介

只有对商场销售数据进行分析,才能了解客户的购买特性,发现不同类别商品的共同特征及其规则,并进而通过这些规则对商场的市场定位、商品定价、新商品采购等进行决策。 本案例采用某大型超市的购物篮数据集,每一组数据表示不同的顾客一次在商场购买的商品 集合。案例的样本数据如表 1.1 所示。


表 1.1 某大型超市的购物篮样本数据

案例使用

读入数据

安装和加载聚类挖掘算法相关的包:arules,用于关联规则的数字化生成,提供 Apriori 和 Eclat

这两种快速挖掘频繁项集和关联规则算法的实现函数。

>install.packages("arules")

>library(arules)

>library(Matrx)                                                                                            

>shopping.df<-as.data.frame(read.csv(file="D:/GLFX/WH.csv",header=F))#读取数据

>shopping.df

数据预处理

将原始数据集转换成数据项集。

每个商品用唯一的一个代码表示如下:

I1:面包 

I2:鸡蛋

I3:西红柿

I4:茄子

I5:皮带

I6:手表

所有的商品可以表示为数据项集

I: I={I1, I2, I3, I4, I5, I6}

每一条交易记录可以表示为一个数据项集:

评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值