![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
hadoop
seuponder
这个作者很懒,什么都没留下…
展开
-
MapReduce,组合式,迭代式,链式
文章转自http://www.cnblogs.com/liqizhou/archive/2012/05/14/2499653.html,感谢作者,这里本人只是做一个记录 1.迭代式mapreduce 一些复杂的任务难以用一次mapreduce处理完成,需要多次mapreduce才能完成任务,例如Pagrank,Kmeans算法都需要多次的迭代,关于mapreduce迭代在m转载 2014-03-01 22:23:38 · 953 阅读 · 0 评论 -
Spark:一个高效的分布式计算系统
概述 什么是Spark Spark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于map reduce算法实现的分布式计算,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是Job中间输出和结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习转载 2014-07-19 22:15:47 · 634 阅读 · 0 评论