Hadoop分布式文件系统(HDFS)
HDFS是Hadoop Distributed File System的简称,意为:Hadoop分布式文件系统。
是Hadoop核心组件之一,作为最底层的分布式存储服务而存在。
分布式文件系统解决的问题就是大数据存储。
它是横跨在多台计算机上的存储系统。
块数据
主从架构
HDFS采用master/slave(主从)架构。一般一个HDFS集群是由一个Namenode和一定数目的Datanode组成。Namenode是HDFS集群主节点,Datanode是HDFS集群从节点,两种角色各司其职,共同协调完成分布式的文件存储服务。
NameNode工作机制
下图为名称节点和辅助名称节点的运作状态:
内存元数据(内存meta data)、磁盘元数据镜像文件(fsimage)、操作日志文件(edits)