![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘
anshuai_aw1
这个作者很懒,什么都没留下…
展开
-
关联规则(一):Apriori算法和FP Tree算法原理总结
关联规则可以说得上是数据挖掘领域最广为人知的一类算法了,起码对于我来说是这样的,在大三时候第一次接触数据挖掘领域就是Apriori算法了,后来又断断续续地接触到了FP Tree算法。现在因为工作的原因,需要进一步了解频繁序列模式挖掘算法PrefixSpan。刘建平老师之前总结过这3个算法。因此我在这里转载过来刘老师的文章,在我理解的角度上,补充一些知识点。本篇博客先介绍Apriori算法和FP...转载 2018-12-24 17:52:57 · 10247 阅读 · 0 评论 -
关联规则(二):PrefixSpan算法原理总结及在pyspark下的实践
参考文献【1】PrefixSpan算法原理总结【2】用Spark学习FP Tree算法和PrefixSpan算法【3】Source code for pyspark.mllib.fpm【4】PrefixSpan【5】PrefixSpan序列模式挖掘算法...转载 2018-12-25 14:39:17 · 3714 阅读 · 0 评论 -
关联规则(三):带时间间隔的序列模式挖掘
序列模式挖掘,即是在序列数据库中挖掘出频繁子序列,是一个具有广泛应用的重要的数据挖掘问题。PrefixSpan 算法可以有效地挖掘出大规模数据的频繁子序列,然而,它并没有项集之间的时间间隔。因此,本文提出了一种带时间间隔的序列模式挖掘算法,我们称其为I-PrefixSpan算法。一、引言带时间间隔的序列模式可以提供比传统序列模式更有价值的信息。我们以零售业务为例:在带时间间隔的序列模式的帮助下...原创 2019-01-24 16:02:48 · 3396 阅读 · 2 评论