机房断电导致HBase集群region offline故障解决

本文介绍了当机房断电导致HBase集群出现region offline和部分HDFS问题时的修复流程。首先,针对HDFS存在的corrupt replica blocks、missing blocks和under replicated blocks,通过调整副本数、删除损坏副本和丢失块进行修复。然后,针对HBase,采用关闭表、清理Zookeeper和HDFS中相关文件,以及重新启动并执行特定修复指令的方法,最终成功恢复数据,但可能造成少量数据丢失。
摘要由CSDN通过智能技术生成

环境描述:ambari集群+hdfs+zookeeper+hbase

错误描述:hdfs 存在部分 corrupt replica blocks/missing blocks/under replicated blockes

Block Errors 31  corrupt replica / 30  missing / 31 under replicated

hbase存在大量的offline regin 和 少量missing region。

修复方法:

1、hdfs修复:

退出hdfs安全模式,不然可能namenode无法启动。

su fdfs
hadoop dfsadmin -safemode leave

查看report报告

hadoop dfsadmin -report

Under replicated blocks    副本数少于指定副本数的block数量
Blocks with corrupt replicas   存在损坏副本的block的数据
Missing blocks        丢失block数量

核心步骤1:更改已经上传文件的副本数,修复Missing blocks

hadoop fs -setrep -R 3 /

核心步骤2:删除已损坏的block

hdfs fsck -delete 

至此,hdfs修复,查看ui,上述3个指标应该都为0.

 

2、h

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值