1. Hadoop版本差异
Hadoop 1.x | hadoop 2.x |
---|---|
MapReduce(计算+资源调度) | MapReduce(计算) |
—— | Yarn(资源调度) |
HDFS(数据存储) | HDFS(数据存储) |
Common(辅助工具) | Common(辅助工具) |
在Hadoop1.x 时代,Hadoop中的Mapreduce同时处理业务逻辑运算和资源的调度,耦合性较大,在Hadoop2.x时代,增加了yarn。yarn只负责资源调度,mapreduce只负责运算。
2.HDFS架构概述
- NameNode(nn): 存储文件的元数据,如文件名称,文件目录结构,文属性(生成时间、副本数、文件权限),以及每个文件的块列表和块所在的DataNode等。
- DataNode(dn):在本地文件系统存储文件块数据,以及块数据的校验和