什么是HDFS?
•在一个多节点块集群存储文件。
•在节点间复制模块
•主从架构。
• 没有文件更新
• 一次写,多次读
• 大数据块 顺序读模式
• 为批处理设计
HDFS主服务器特点:
NameNode
- 运行在单个节点服务器上作为主处理器
? 存有文件的元数据(哪个数据块在哪里)
? 直接访问文件的客户端
• SecondaryNameNode
- 不是一个热点容错
- 维持NameNode的元数据拷贝
HDFS从服务器特点:
DataNode
- 一般运行在集群中所有节点
? 堵塞 creation/replication/deletion/reads
? 从NameNode获取等级次序
HDFS的文件存储原理
假设一个文件如图由红绿蓝三个数据块组成,现在将演示如何写入到HDFS系统中: