因为集群升级扩容后多次断电、重启,可能导致存储在hbase中的监控数据的block丢了
su hdfs
hadoop dfsadmin -safemode leave(退出安全模式)
hadoop dfs -list-corruptfileblocks(检查HDFS丢失的block)
hdfs fsck / -delete(个人发现丢失block都是跟监控相关的不重要数据,索性执行此命令删除丢失的block)
修复hbase:
hbase hbck -fixVersionFile
hbase hbck -repair