关注微信公共号:小程在线
关注CSDN博客:程志伟的博客
上一篇的关联规则是按照R包arules里面的数据集做的。把数据集导入到本地后,然后在进行关联关联规则时发现9000多人,每个人只购买了1件商品,根本不能进行关联规则。这个问题其实就是数据格式的问题。
原数据集是这样的:
sizes表明9836人没人买一件商品,没法进行关联分析
调整后的数据集是这样的:
summary(a)
sizes:可以看到购买每个商品数量的人数
实现过程:
进行数据的变换:
原数据:
这个是数据集本身的数据下载到本地的。
变换后的数据就是讲顾客的id删除,把{}删除。
b<-read.transactions("D:\\gouwu.csv",format = "basket", sep=",")
summary(b)
以后就可以按照上一篇关联规则进行数据分析。