HDFS和mapReduce共同组成了分布式系统体系结构的核心。
(1) HDFS实现分布式存储。
HDFS集群是由一个namenode和若干个datanode组成。
namenode作为主服务器,管理文件系统的命名空间和客户端对文件的访问操作。
datanode管理存储的数据,负责处理文件系统客户端的请求,并在namenode的调度下进行数据块的创建、删除和复制工作。
(2) mapReduce实现并行计算。
mapReduce框架是由一个单独运行在主节点上的 jobTracker和运行在每个从节点的TaskTracker共同组成的。