一直想做购物篮分析,但是R语言做的总是理解不透,过段时间就忘记,所以想着用excel跟着做一遍是不是能理解的透彻一点。
先随便建个简单的数据集,简单就好,我自己能看的明白。
先用R写一下:
9笔交易,4个商品,密度是0.53;
C商品有6笔交易,B商品有5笔交易,……;
只有1个商品的交易有3笔,含2个商品的有2笔,含3个商品的交易有4笔。
inspect看一下
以上summary内容用excel也可以展示:
然后可以对数据进行展示等等。
apriori:
直接apriori和剔除交易中只有1个商品(gwl[size(gwl)>1)结果有点小差别。(待懂)
如果用excel,两两相关还是可以展示的,支持度,置信度,提升度就要自己手动计算。
两两相关,power query做个笛卡尔乘积
然后商品1&商品2只要不是相同的就可以组合,购物篮1=购物篮2就说明两个在同一个购物篮里。
三个商品同篮按此思路也可以做,麻烦点。
两两相关可以整理出来看看之间的关联程度。
转载于:https://blog.51cto.com/11729955/2152791