目录
1.MapReduce基本概念
MapReduce是hadoop的三大核心组件(HDFS、Yarn、MapReduce)之一,MapReduce是一种分布式的运算编程框架,用java语言编写。
MapReduce的核心功能就是将用户自己编写的业务逻辑代码和自带的规范和组件结合起来组成一个完整的分布式运算程序,并发运行在Hadoop集群上。通俗一点讲就是我们在MapReduce定义的规范和组件基础上编写业务逻辑代码,最终形成一个分布式的运算程序。
作为一个运算程序框架,MapReduce的基本工作流程是:我们给定一个输入(input),MapReduce程序操作这个输入,通过本身定义好的计算模型,得到一个输出(output)。
2.MapReduce的工作原理
2.1 基本描述
前面我们讲了MapReduce根据指定的输入得到一个输出,那么MapReduce是怎么实现的呢?
一个完整的MapReduce框架由三部分组成ÿ