- 博客(1)
- 收藏
- 关注
翻译 MapReduce 的shuffer详解
MapReduce确保每个reducer的输入都是按键排序的,系统执行排序,将map输出作为输入传给reducer的过程称为shuffle map函数开始产生输出时,并不是简单的将它写到磁盘,这个过程更复杂,它利用缓冲的方式写到内存并出入效率的考虑进行预排序 每个map任务都有一个环形内存缓冲区用于存储任务输出,在默认情况下,缓冲区的大小为100MB,这个值可以改变mapreduce.task...
2018-09-04 21:23:47 632
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人