MapReduce定义
MapReduce是一个分布式运算程序的编程框架,是基于Hadoop的数据分析计算的核心框架。
MapReduce处理过程分为两个阶段:Map阶段和Reduce阶段
Map负责把一个任务分解成多个任务
Reduce负责把分解后多任务处理的结果汇总
MapReduce优点
易于编程
简单实现一些接口,就可以完成一个分布式程序,这个分布式程序可以分布到大量廉价的PC机器上运行。也就是写一个分布式程序,跟写一个串行程序是一样的。因为这个地点使得MapReduce编程变得非常流行。
良好的扩展性