Data Mining
文章平均质量分 94
LuLuLee
这个作者很懒,什么都没留下…
展开
-
Large-Scale Frequent Sequence Mining
Mind the Gap: Large-Scale Frequent Sequence Mining (注意间隙:大规模频繁序列挖掘) 摘要 频繁数据挖掘是数据挖掘中一个基本部分。并且该问题已经得到了广泛的研究,一些可用的技术扩展处理数以百亿级的数据集;这种大规模数据集的增长,比如,在文本挖掘和会话分析。在本文中,我们提出了MG-FSM,一种可扩展性算法利用MapReduce处理频繁序列挖掘翻译 2013-12-09 15:42:13 · 1144 阅读 · 0 评论 -
PageRank
PageRank生成的Web网页排序是静态的,这是指每个网页的排序值是通过离线计算得到的,并且该值与查询无关。也就是说,网页排序值的计算纯粹基于Web上现有链接,而不考虑任何用户的任何查询。 知识背景: 马尔可夫链,因俄罗斯数学家安德烈·马尔可夫(俄语:Андрей Андреевич Марков)得名,是数学中具有马尔可夫性质的离散时间随机过程。该过程中,在给定当前知识原创 2014-03-12 16:49:48 · 1422 阅读 · 0 评论