客户端崩溃时,便不可以周期性地更新租约,此时namenode便可以感知到。
当数据写入过程中客户端异常退出时,同一数据块的不同副本可能存在不一致的状态,选择某一副本作为主数据节点,协调其他数据节点,将该数据块恢复到他们中的最小长度。数据块恢复配合租约恢复时HDFS中故障恢复的重要机制。
lease recovery 算法:
1.NameNode查找lease信息。
2.对于客户端lease中的每个文件f,令b为f的最后一个block,做如下操作:
a.获取b所在的datanode列表。
b.令其中一个datanode作为primarydatanode p。
c. p从namenode获取最新的时间戳。
d. p从每个datanode获取block信息。
e. p计算最小的block长度。
f. p用最小的block长度和最新的时间戳来更新具有有效时间戳的datanode。
g. p通知namenode更新结果。
h.namenode更新BlockInfo。
i.namenode从lease中删除f,如果此时该lease中所有文件都已被删除,将删除该lease。
j.namenode提交修改的EditLog。
k.当客户端恢复后,重新与namenode通信,此时namenode租约已删除,客户端会以append的方式继续写入即可。