MapReduce概述 源自于Google的MapReduce论文,论文发表于2004年12月Hadoop的MapReduce是Google MapReduce的克隆版。与HDFS非常类似。 MapReduce是分布式框架中的计算框架。分布式其实就是将一个作业在多个节点上运行,多个节点之间通信与高可靠性都是非常难以实现的。 MapReduce的优点实现海量数据离线处理,易开发,易运行 MapReduce的缺点是实时流式计算。