Hadoop中包括两个重要组成部分:1.文件系统HDFS,2.一个是MapReduce并行计算框架
HDFS设计架构。
-块(Block)-NameNode -DataNode
块在操作系统文件系统中指一个固定大小的逻辑单元
HDFS的文件被分成块进行存储,HDFS块的默认大小64MB,块是文件存储处理的逻辑单元
HDFS中有两类节点,NameNode和DataNode
NameNode是管理节点,存放文件元数据:
1.文件与数据块的映射表2.数据块与数据节点的映射表
客户如何查询访问请求,客户端向管理节点NameNode查询元数据,返回的结果,知道这个文件存放在哪些节点上面,然后依次向这些节点去拿数据块,得到数据块之后,组装拼接成之前想要的文件。
DataNode是HDFS的工作节点,存放数据块。