- 博客(1)
- 收藏
- 关注
转载 MapReduce Terasort算法分析
1.概述1TB排序通常用于衡量分布式数据处理框架的数据处理能力。Terasort是Hadoop中的的一个排序作业,在2008年,Hadoop在1TB排序基准评估中赢得第一名,耗时209秒。那么Terasort在Hadoop中是怎样实现的呢?本文主要从算法设计角度分析Terasort作业。2.算法思想实际上,当我们要把传统的串行排序算法设计成并行的排序算法时,通常会想到分而治之的策略,即:把要...
2019-07-12 16:01:37 1322
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人