Hbase的Hmaster高可用分布式报错probably a clock skew

#事件起因:

本次生产环境事件的起因是由于为了验证当服务器时间晚于当前时间是否会对hadoop集群造成影响。实际操作,将整个集群的服务器时间修改为2050-01-01.

基本环境

服务器5台
hadoop1	10.212.51.10	namenode、resourcemanager、zkfc、hmaster
hadoop2  10.212.51.11	namenode、resourcemanager、zkfc、hmaster
hadoop3  10.212.51.12	JournalNode、datanode、NodeManager、zk、regionserver
hadoop4  10.212.51.11	JournalNode、datanode、NodeManager、zk、regionserver
hadoop5  10.212.51.11	JournalNode、datanode、NodeManager、zk、regionserver

事件发生过程

#1. 修改服务器时间
date -s 2050-01-01
之后将时间恢复正常现在的时间,导致hbase访问异常报错如下,此处是看的master的日志,建议所有节点的日志都查看一下。
vim $hbasehome/log/hbase/hbase-hadoop1.log

日志内容

在这里插入图片描述
在这里插入图片描述
第一张图提到probably a clock skew时间偏移
第二张图红框是重点

问题排查过程

根据日志提示可以看出是这个目录/sfdcloud/hbase/oldWALs中的文件时间戳不正确。导致平台异常,无法正常提供服务。在这里插入图片描述

处理问题

删除oldWALs
hdfs dfs -rmr /sfdcloud/hbase/oldWALs

删除完成后操作

关闭hbase、hadoop、zookeeper
重新启动整个集群,备注:胖虎当时还重置了zookeeper,如何重置zookeeper请自行查阅。下面是简单的说法。
在这里插入图片描述

格式化 ZKFC

这个操作是如果将zokeeper节点数据删除了,那么就需要重新初始化。
/opt/hadoop/bin/hdfs zkfc -formatZK

至此,由于修改了时间之后导致的hbase平台异常的问题处理完成。
***备注:此方式没有验证是否有丢数据的风险,有待验证。***
作者:一只胖胖虎

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值