看书标记【R语言 商务数据分析实战2】


【R语言 商务数据分析实战2】


chapter 2

商品零售购物篮分析

历史数据作为训练>>集建立模型>>分析热销商品+增量数据>>Apriori关联规则分析>>模型应用>>分析结果+迭代优化模型

2.2 分析商品销售状况

分析热销商品>>分析商品结构

统计每种已销售商品的频数和其总占比

# 设置工作目录并读取数据
setwd()
GoodsOrder <- read.csv("./data/GoodsOrder.csv", stringsAsFactors = FALSE)
# 统计热销商品
hotGoods <- data.frame(table(GoodsOrder[, 2]))
names(hotGoods) <- c("Goods", "Num")
hotGoods["Percent"] <- hotGoods$Num / sum(hotGoods$Num)
hotGoods <- hotGoods[order(hotGoods$Percent, decreasing = TRUE),]
write.csv(hotGoods, "./tmp/hotGoods.csv", row.names = FALSE)

对每种已销售商品进行归类,并算其总占比

# 售出商品类型结构分析
GoodTypes <- read.csv("./data/GoodsTypes.csv", stringsAsFactors = FALSE)
Goods <- merge(GoodsOrder, GoodTypes, 'Goods', all.x = TRUE, all.y = TRUE)
hotTypes <- data.frame(table(Goods$Types))
names(hotTypes) <- c("Types", "Num")
hotTypes["Percent"] <- hotTypes[, 2] / sum(hotTypes[, 2])
hotTypes <- hotTypes[order(hotTypes$Percent, decreasing = TRUE),]
write.csv(hotTypes, "./tmp/hotTypes.csv", row.names = FALSE)

分析类别内部商品的分布

# 售出商品类型内部结构分析
Drink <- Goods[which(Goods[,3] == "非酒精饮料"),]
hotDrink <- data.frame(table(Drink$Goods))
names(hotDrink) <- c("Goods", "Num")
hotDrink["Percent"] <- hotDrink$Num / sum(hotDrink$Num)
hotDrink <- hotDrink[order(hotDrink$Percent, decreasing = TRUE),]
write.csv(hotDrink, './tmp/hotDrink.csv', row.names = FALSE)
2.3 使用Apriori关联规则构建购物篮分析模型

一些原理术语:1.置信度、支持度和提升度。2.频繁项集(用于产生产生关联规则)
Apriori算法应用很广泛,但计算量有很大的重复部分,所以计算量较大,在试验时,通过调整parameter参数,得到较合适的关联规则数目。

# 设置工作目录并读取数据
setwd()
GoodsOrder <- read.csv("./data/GoodsOrder.csv", stringsAsFactors = FALSE)
library(arules)  # 导入所需库包

# 数据形式转换
dataList <- list()
for (i in unique(GoodsOrder$ID)) {
    dataList[[i]] <- GoodsOrder[which(GoodsOrder$ID == i), 2]
}
TransRep <- as(dataList, "transactions")
RulesRep <- apriori(TransRep, parameter = list(support = 0.02, confidence = 0.25))
inspect(sort(RulesRep, by = "lift")[1:25])  # 按提升度从高到低查看前25条规则
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值