一、DataNode
- 用于存储数据,注意数据是以Block形式存储
- 数据在DataNode上的存储位置由hadoop.tmp.dir属性决定,存储目录是dfs/data/current/块池/current/finalized/subdir0/subdir0
- DataNode会通过心跳机制(RPC方式)来向NameNode发送心跳信息
Hadoop的HDFS体系结构
二、SecondaryNameNode
- SecondaryNameNode只是辅助NameNode进行元数据的合并
- SecondaryNameNode能起到一定的备份作用,但是不能做到和NameNode之间进行实时热备 - 在实际开发中,一旦利用到SecondaryNameNode进行了备份,往往意味着数据已经产生了丢失
- 在HDFS中,最核心节点一定是NameNode,也因此在Hadoop2.0的完全分布式中,为了做到NameNode的热备,舍弃了SecondaryNameNode
三、复本放置策略
-
在HDFS中,默认是多复本策略,默认复本数