1、Hadoop带有用Java语言编写的框架,因此运行在 Linux 生产平台上是非常理想的。
Nutch是一个应用程序,是一个以Lucene为基础实现的搜索引擎应用。在Nutch0.8.0版本之前,Hadoop还属于Nutch的一部分,而从Nutch0.8.0开始,将其中实现的NDFS和MapReduce剥离出来成立一个新的开源项目,这就是Hadoop。
Hadoop中实现了Google的GFS和MapReduce算法,使Hadoop成为了一个分布式的计算平台
2、Hadoop是项目的总称,起源于作者儿子的一只玩具大象的名字。主要是由HDFS、MapReduce和HBase组成
HDFS是Google File System(GFS)的开源实现。
MapReduce是Google MapReduce的开源实现。
HBase是Google BigTable的开源实现
3、Apache 的Hadoop项目目前包括以下三个项目
Hadoop Common:支持其他Hadoop子项目的通用工具类
HDFS:一个提供高吞吐量应用数据访问的分布式文件系统
MapReduce:计算机集群大数据量的分布式计算
4、 Hadoop,也有人将其称之为云计算的杀手应用程序