- 背景介绍
1.1 项目概要
购物篮分析是通过发现顾客在一次购买行为中放入购物篮中不同商品之间的关联,研究顾客的购买行为,从而辅助零售企业制定营销策略的一种数据分析方法。
本研究通过对某商品零售企业的9,835个购物篮数据进行分析,其中包含169个不同的商品类别,售出商品总数为43,367件,进而得到顾客购买行为特征。根据发现的规律采取有效的行动,制定商品摆放等计划,以达到增加商场销量的目的。
1.2 购物篮分析流程
- 分析商品热销情况和商品结构。
- 转换数据形式,使之符合Apriori关联规则算法要求。
- 使用Apriori关联规则算法完成商品关联性分析。
- 根据分析结果给出销售建议。
2. 读取数据
library(arules)
library(wordcloud2)
library(ggplot2)
GoodOrder <- read.csv("dataGoodsOrder.csv")
GoodsTypes <- read.csv("GoodsTypes.csv")
head(GoodOrder,10)
数据集介绍:GoodOrder表为43,367条记录,2个字段,其中ID为购物篮编号,Goods为售出商品名称。
## ID Goods
## 1 1 柑橘类水果
## 2 1 人造黄油
## 3 1 即食汤
## 4 1 半成品面包
## 5 2 咖啡
## 6 2 热带水果
## 7 2 酸奶
## 8 3 全脂牛奶
## 9 4 奶油乳酪
## 10 4 肉泥
3. 分析商品的热销情况与商品结构
3.1 热销商品情况
hotGoods <- data.frame(table(GoodOrder[,2]))
names(hotGoods) <- c("Goods","Num")
hotGoods$Percent <- hotGoods$Num / sum(hotGoods$Num)
hotGoods <- hotGoods[order(hotGoods$Percent, decreasing = T),] #商品按销量降序排列
write.csv(hotGoods, "./data/hotGoods.csv", row.names = F) #导出数据
set.seed(3)
wordcloud2(hotGoods[1:60,1:2],size = 0.65) #制作销量前60的商品名称词云