fpGrowth
文章平均质量分 50
夏决未央
这个作者很懒,什么都没留下…
展开
-
FP-growth算法原理及python实现(详细代码解释)
目录算法简介构建FP树挖掘频繁项集算法简介FP-growth算法的应用我们经常接触到。比如,你在百度的搜索框内输入某个字或词,搜索引擎会自动补全查询词项,而这些词项都是和搜索词经常一起出现的。 FP-growth算法被用来挖掘频繁项集,也就是说从已给的多条数据记录中挖掘出哪些项是频繁一起出现的。该算法适用于标称型数据,即离散型数据。它比Apriori算法更高效,因为该算...原创 2018-11-02 17:11:28 · 19510 阅读 · 13 评论 -
FP-growth算法应用实例(基于python)
我把关于FP-Growth的算法原理,python实现代码,以及代码解读放在了另外一篇文章:有兴趣可以看看。这篇文章给出该算法的一个很酷的实例应用。我们将用到一个叫 kosarak.dat 的数据集,可以从这里下载。这份数据集包含将近100万条记录,对于展示FP-Growth算法的速度十分有效。该文件的每一行包含某个用户浏览过的新闻报道。用户和报道被编码成整数。为了看起来方便,还是先放一下...原创 2018-11-05 19:16:27 · 6139 阅读 · 2 评论