苏果超市R语言关联分析

本文通过对苏果超市销售数据的分析,揭示了小吃类商品销量高、香烟销售额高等特点。同时,研究了销售时间对销售额的影响,发现在节假日存在明显峰值。在关联分析中,运用R语言的apriori算法,发现了如雪碧与可口可乐、青菜包与五香鸡蛋、烤肠与甜不辣等商品之间的关联规则。
摘要由CSDN通过智能技术生成

一、超市总体销售情况
1.1.数据预处理
读取超市数据并命名数据集 dat,观察数据,并更改原始数据中时间的记录方式:

dat<-read.csv("某超市销售数据.csv")
dat$销售时间<-format(dat$销售时间,scientific=FALSE)

由于售货员姓名对分析不产生影响,删除该列,并重新命名各列:

dat<-dat[,-c(1)]
names(dat)<-c("ID","time","No.","item","price","num","total")
as.factor(dat$item)#将产品名称设置为因子变量

为了分别按照日期和时间段进行分析,把销售时间拆分为两部分,销售日期和销售时间。

date<-substr(dat$time,1,8)
hour<-substr(dat$time,9,10)#文本拆分,按照日期与时间
dat<-data.frame(dat,date=date,hour=hour)#更新数据集

1.2不同产品的销售量及销售额
此处利用tapply函数进行分组计算,分别得到每种产品的销售额及销售量,并进行排序:

cp<-tapply(dat$total,dat$item,sum)#计算每种产品的销售额
cpn<-tapply(dat$num,dat$item,sum)#计算每种产品的销售量
cp<-data.frame(cp)
cpn<-data.frame(cpn)
ocpn<-cpn[order(cpn,decreasing = T),]#对产品销售量进行排序
ocp<-cp[order(cp,decreasing = T),]#对产品销售额进行排序

可以发现,销量较高的产品中,小吃类占大多数。

销售额较高的则主要是香烟,对于烤肠这种成本低,销售额却高的产品,看来是每家超市必进的商品。
1.4对不同时间段超市运营情况的分析
想要从时间角度来对超市运营情况分析,首先要做的就是对数据集按照不同的时间分布来进行合并,此处我们分别按照日期和小时来进行数据的合并。

datecp<-tapply(dat$total,dat$date,sum)
hourcp<-tapply(dat$total,dat$hour,sum)

tapply函数得到的结果是一组向量,并且是带行名的向量,因此需要对所得到数据集进行一个处理方便后续分析。

days<-rownames(datecp)
hour<-rownames(hourcp)
cp<-as.vector(hourcp)
hourcp<-data.frame(hour=
  • 3
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 6
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值