数据挖掘实验（三）：Apriori算法 R语言

最新推荐文章于 2025-09-01 00:06:27 发布

原创

最新推荐文章于 2025-09-01 00:06:27 发布 · 1.4k 阅读

9 ·

CC 4.0 BY-SA版权

文章标签：

#r语言 #数据挖掘 #算法

该博客介绍了如何使用R语言进行数据挖掘实验，重点在于应用Apriori算法。实验目的是通过逐层迭代方法找出频繁项集，所使用的软件是RStudio。文中包含了具体的源代码实现。

一、实验目的：

使用逐层迭代方法基于候选产生找出频繁项集

二、实验软件：

Rstudio

三、源代码：

#1数据准备并统计数据频数
da1<-c("A","B","C","F","E")
da2<-c("B","C","E")
da3<-c("A","C","D")
listda<-list(da1,da2,da3)
data<-as.data.frame(table(unlist(listda)))


Apriori<-function(data,listda,min_sup){
   
   
#n项统计频数.....
  test<-function(re,lis){
   
   
    req<-c() #记录数据框中每行数据在整个列表中出现的频次
    for(i in 1:nrow(re)){
   
   
      count<-0 #记录数据框中每次每行数据出现的频次
      for(j in 1:length(lis)){
   
   
        if(all(as.vector(as.matrix(re[i,])) %in% lis[[j]])){
   
    #判断给出的数据是每个列表数据的子集
          count<-count+1
        }
      }
      req[i]<-count
    }
    return(req)
  }
  
#剪枝，即选取满足最小支持度数的项集
  reduce<-function(data,min_sup){
   
   
    test1<-subset(data,data[,ncol(data)]>min_sup)
  }
  
#一