数据集来自 arules 包,名为 Groceries。这个数据集包含了一个真实杂货店的 30 天交易信息,共有 9835 条购买记录。所有售出商品被分成 169 类,比如面包、葡萄酒、肉类等。要求从数据集中为杂货店发现关联规则。
```{r}
# TODO
library(arules) #加载arules程序包
data("Groceries") #调用数据文件
head(Groceries) #查看
summary(Groceries) #查看数据的基本统计量
```
```{r}
basketSize<-size(Groceries) #basketSize表示每笔交易包含商品的数目
itemFrequency(Groceries) #计算每个商品的支持度,itemFrequency函数
```
```{r}
itemFreq <- sort(itemFrequency(Groceries),decreasing = T) #计算支持度,并降序排列
itemFrequencyPlot(Groceries, support=0.1) #查看支持度大于0.1的所有商品
itemFrequencyPlot(Groceries,topN=10,horiz=T) #查看支持度最大的前10种商品
```
```{r}
#根据业务对数据集进行过滤,获得规则挖掘的数据集
Groceries_use <-Groceries[basketSize > 1]
summary(Groceri