下面以最常用的R语言为例,解析Apriori算法的基本分析思路。
R 语言中关于关联分析的开发包非常丰富,有arulesCBA、arulesNBminer、Opusminer、RKEEL 、arulesSequences、RSarules等,这里主要以基础的arules、arulesViz等开发包。
以Groceries数据集为示范,介绍Apriori算法的关联分析步骤。
下面范例使用的是R version 4.1.2(RStudio)开发环境。
1、#载入算法包及购物篮数据库
> install.packages(“arulesViz”) #安装Apriori算法可视化开发包
>library(arules) #载入关联规则包
>Library(arulesViz) #载入关联规则的数据可视化
>Library(RColorBrewer) # 载入图形调色板
>data(Groceries) #调用R自带超市数据集Groceries
2、对Groceries数据集进行观察:
>print(levels(itemInfo(Groceries)[[“level1”]])) # 查看Groceries数据库一级商品品类,显示如下:
[1] “canned food” “detergent” “drinks”
[4] “fresh products” “fruit and vegetables” “meat and sausage”
[7] “non-food” “perfumery” “processed food”
[10] “snacks and candies”
# 显示结果表示Groc