本文目录
1.MapReduce定义
MapReduce,简称:MR
。 是一个分布式运算程序的编程框架,是用户开发“基于 Hadoop 的数据分析应用”的核心框架。
MapReduce 核心功能是:将用户编写的业务逻辑代码和Hadoop自带默认组件整合成一个完整的分布式运算程序,并发运行在一个 Hadoop 集群上。(即:我们只需关注业务逻辑代码即可,框架会帮我们整合成一个分布式运算程序,跑在Hadoop集群上)
2.MapReduce优缺点
Ⅰ.优点
-
MapReduce易于编程
MapReduce,它只需要我们简单的实现一些接口,编写好业务逻辑代码,就可以完成一个分布式程序
。这个分布式程序可以分不到大量廉价的PC机器上运行。也就是说我们写一个分布式程序,跟写一个简单的串行程序是一模一样的。就是因为这个特点,使得MapReduce编程变得非常流行。
-
良好的扩展性
当计算资源不能得到满足的时候,我们可以通