如果向DataNode写入数据失败了怎么办?
如果这种情况发生,那么就会执行一些操作:
① Pipeline数据流管道会被关闭,ACK queue中的packets会被添加到data queue的前面以确保不会发生packets数据包的丢失
② 在正常的DataNode节点上的以保存好的block的ID版本会升级——这样发生故障的DataNode节点上的block数据会在节点恢复正常后被删除,失效节点也会被从Pipeline中删除
③ 剩下的数据会被写入到Pipeline数据流管道中的其他两个节点中
1、Hadoop深入学习:解析HDFS的写文件流程
http://flyingdutchman.iteye.com/blog/1900536
2、HDFS 1. 读写流程剖析
https://www.jianshu.com/p/7d1bdd23c460
3、HDFS 异常处理与恢复
http://www.cnblogs.com/mindwind/p/4833098.html