主要在学习一篇文章http://www.cnblogs.com/sharpxiajun/p/3151395.html过程中,算是自己整理笔记的过程,顺便整理自己理解的思路,可能后续会不断修改。
MapReduce基础介绍
Mapreduce 是一个计算框架(标准是有一个输入),通过本身定义好的计算模型,得到一个输出,这个输出就是我们所需要的结果。这里主要是解释这个计算模型的规则,在运行一个mapreduce计算任务时,任务过程被分为两个阶段:map阶段和reduce阶段,每个阶段都是以key/value作为输入和输出。而两个阶段的函数map函数和reduce函数需要自己定义。
我这里也放几张图片,虽然有几张没懂,但是先留着后续有了新的理解可以参考参考