一.HDFS故障类型
1.节点故障
1.1 namenode挂了,整个集群挂
1.2 datanode 3秒 发送心跳信号,如果 namenode 未接收到心跳信号,datanode 挂。
2.通讯故障
发送数据,接受应答。未接受到应答则认为通讯故障。
3.数据损坏
校验和
二.HDFS故障处理
1.读故障
读数据时,namenode会返回所有datanode的位置,如果从某个datanode无法读数据,会跳过该datanode并选择其他datanode读数据。
2.写故障
写数据未收到应答,会跳过该datanode,写入其他datanode,稍后等namenode处理此datanode
3.datanode故障
移除故障datanode,并指定其他datanode拷贝数据