1.工作机制
1.一个数据块在DataNode上以文件形式存储在磁盘上,包括俩个文件,一个是数据本身,一个是元数据(数据块长度,校验和,时间戳)。
2.DataNode启动后向NameNode注册,通过后,周期性(1小时)地向NameNode汇报所有块信息。
3.心跳是每3秒一次,心跳返回结果带有NameNode给DataNode的命令,如复制快数据到另一节点,或对块进行操作,如果超过10分钟没有收到DataNode的心跳信息,则视为此DataNode不可用。
4.在集群中,DataNode是可以自由的退出和添加的。
2.掉线时限配置
1.DataNode进场死亡或者由于网络故障造成NameNode与DataNode无法通信时,NameNode不会立即判定DataNode死亡,而是经过一段时间。这段时间称之为“超时时长”。HDFS默认的超时时长是10m+30s。将超时时长定义成timeout.则:
timtout = 2* dfs.namenode.heartbeat.recheck.interval(毫秒,默认5分钟),+10* dfs.namenode.interval(秒,默认3秒)(hdfs-site配置)