R语言包arules进行频繁项集挖掘的最简单例子

蛐蛐蛐

于 2018-06-03 00:52:14 发布

阅读量5.3k

点赞数

分类专栏： GHTorrent数据集

本文链接：https://blog.csdn.net/qysh123/article/details/80553603

版权

GHTorrent数据集专栏收录该内容

5 篇文章 0 订阅

订阅专栏

arules是进行频繁项集挖掘（frequent itemset mining）的有效工具，不过我在使用的时候发现网上很多例子都比较繁琐，这里总结一下其中apriori方法的最简单使用方法，这里首先给出代码：

files_change<-read.transactions(input_file, format="basket", sep=",")
summary(files_change)
rules<-apriori(files_change,parameter=list(support=0.015,confidence=0.15,minlen=2,maxlen=2))
write(rules, file=output_file, sep=",", quote=TRUE, row.names=FALSE)

进行一些最简单解释，第一行代码读入文件，这里唯一需要注意的就是我们选择的数据文件的format是basket，例如这里的数据文件格式：https://github.com/TigerInnovate/PredictiveModeling/blob/master/groceries.csv

第三行需要注意的就是support、confidence这些值的设定。最后一行是直接将mining出来的rule进行输出。

提供一些有用的链接：

arules的官方文档：https://cran.r-project.org/web/packages/arules/arules.pdf

介绍得比较详细的博客文章：https://blog.csdn.net/gjwang1983/article/details/45015203

蛐蛐蛐

关注

0
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
R语言包arules进行频繁项集挖掘的最简单例子

arules是进行频繁项集挖掘（frequent itemset mining）的有效工具，不过我在使用的时候发现网上很多例子都比较繁琐，这里总结一下其中apriori方法的最简单使用方法，这里首先给出代码：files_change&lt;-read.transactions(input_file, format="basket", sep=",")summary(files_change)r...
复制链接

扫一扫

专栏目录