HDFS数据恢复之Block Missing

当两台HDFS集群机器出现故障,导致27个block丢失并触发Block Missing报警时,通过获取missing block列表,从故障机器恢复数据,然后在新机器上恢复目录结构并启动datanode,最终通过fsck确保文件系统健康。虽然HDFS通常有自愈能力,但处理missing block仍需手动介入,且有时会出现诡异问题。HDFS提供debug工具用于验证block和meta文件一致性。
摘要由CSDN通过智能技术生成

背景

报警得知2台机器宕机,推测是IDC同事在处理之前的报修。一台是系统盘故障,12块数据盘正常。一台是某块数据盘损坏。两台机器宕机时间相差不大,副本未自动补偿完毕,导致有27block丢失,发生Block Missing,若干新旧文件发生corrupt


解决方案

  1. 获得missing block列表,通过namenode即可获得。
  2. 通过ramos进入系统盘损坏的机器,将全部的missing block找到,依照原目录打包。
  3. 将上述文件拷贝至新机器,恢复正常目录结构,并部署和启动datanode
  4. 稍等片刻,跟踪新节点日志,并执行fsck
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值