2015年10月_煜涵

12月 11月 10月 09月 08月 06月 04月 03月 02月 01月

转载 MapReduce:详解Shuffle过程

转自：http://langyu.iteye.com/blog/992916 Shuffle过程是MapReduce的核心，也被称为奇迹发生的地方。要想理解MapReduce， Shuffle是必须要了解的。我看过很多相关的资料，但每次看完都云里雾里的绕着，很难理清大致的逻辑，反而越搅越混。前段时间在做MapReduce job 性能调优的工作，需要深入代码研究MapReduce

2015-10-14 21:50:39 255

转载 Hadoop中Partition解析

1.解析Partition Map的结果，会通过partition分发到Reducer上，Reducer做完Reduce操作后，通过OutputFormat，进行输出，下面我们就来分析参与这个过程的类。 Mapper的结果，可能送到Combiner做合并，Combiner在系统中并没有自己的基类，而是用Reducer作为Combiner的基类，他们对外的功能是一样的，只是使用的位置和使

2015-10-14 21:46:00 537

原创在hadoop中，map->combine->partition->shuffle->reduce，五个步骤的作用

combine分为map端和reduce端，作用是把同一个key的键值对合并在一起，可以自定义的。 Mapper最终处理的键值对<key, value>，是需要送到Reducer去合并的，合并的时候，有相同key的键/值对会送到同一个Reducer那。哪个key到哪个Reducer的分配过程，是由Partitioner规定的

2015-10-14 21:45:19 441

东软招聘笔试题

东软考试题。有时候简单，有时候难些，多看看有必要。如果会日语好像会有优势！

2014-07-16

phpStudy集成工具

php集成开发环境。phpStudy 包含很多东西，集成环境，简单方便。避免错误

2014-07-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人