Large-Scale Frequent Sequence Mining
Mind the Gap: Large-Scale Frequent Sequence Mining
(注意间隙:大规模频繁序列挖掘)
摘要
频繁数据挖掘是数据挖掘中一个基本部分。并且该问题已经得到了广泛的研究,一些可用的技术扩展处理数以百亿级的数据集;这种大规模数据集的增长,比如,在文本挖掘和会话分析。在本文中,我们提出了MG-FSM,一种可扩展性算法利用MapReduce处理频繁序列挖掘
翻译
2013-12-09 15:42:13 ·
1119 阅读 ·
0 评论