迭代MapReduce
文章平均质量分 80
dandingyy
这个作者很懒,什么都没留下…
展开
-
迭代式mapreduce
董的博客:《迭代式mapreduce框架介绍》网址:http://dongxicheng.org/mapreduce/iterative-mapreduce-intro/小e的分享:《迭代式MapReduce解决方案》:http://www.wikieno.com/2012/02/iterative-mapred-summary-haloop/1.概述 对于传统的MapReduce框转载 2012-05-15 15:06:36 · 2830 阅读 · 0 评论 -
Hadoop DistributedCache
1、DistributedCache In Hadoop此篇文章主要是前一篇的后续,主要讲Hadoop的分布式缓存机制的原理与运用。分布式缓存在MapReduce中称之为DistributedCache,它可以方便map task之间或者reduce task之间共享一些信息,同时也可以将第三方包添加到其classpath路径中去。Hadoop会将缓存数据分发到集群的所有准备启动的节点上,转载 2012-05-15 16:32:31 · 4214 阅读 · 1 评论 -
Haloop介绍
Haloop用户手册:http://code.google.com/p/haloop/wiki/UserManual 1.介绍Haloop是一个Hadoop MapReduce框架的修改版本,其目标是为了高效支持 迭代,递归数据 分析任务,如PageRank,HITs,K-means,sssp等。递归的连接可能在map端(K-means),也可能在reduce端(PageRank)。转载 2012-05-15 16:31:49 · 5048 阅读 · 0 评论