源自于Google的MapReduce论文,论文发表于2004年12月
Hadoop MapReduce是Google MapReduce的克隆版
Mapreduce 优点:海量数据离线处理 /易开发/易运行
Mapreduce缺点:实时流数据计算
Hadoop MapReduce is a software framework for easily writing applications which process vast amounts of data (multi-terabyte data-sets) in-parallel on large clusters (thousands of nodes) of commodity hardware in a reliable, fault-tolerant manner.
Hadoop MapReduce是一个软件框架,用于轻松编写应用程序,这些应用程序以可靠、容错的方式在大型群集(数千个节点)的商用硬件上并行处理大量数据(多TB数据集)。