hbase奇怪问题现场

最新推荐文章于 2024-08-09 15:41:02 发布

fangbinyu

最新推荐文章于 2024-08-09 15:41:02 发布

阅读量427

点赞数

分类专栏： hbase 文章标签： hbase hadoop集群 zookeeper 异常

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/fangbinyu/article/details/37873083

版权

hbase 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

前一段时间给hadoop集群加了一个新节点，但是出现了一个非常奇怪的现象，到目前为止，问题还没找到，但是应该可以重现问题；先记录下来，等回头有时间，则重现问题；
我使用的hadoop版本1.0.2 hbase版本0.94 全部是社区的原版；
现场重现

7月10号下午16点：做好新节点配置，启动datanode，正常！启动regionserver正常；

7月11号上午9点：发现该节点regionserver进行挂掉；已经自动退出；datanode进程健在；

查看regionserver日志，发现日志的记录时间是从7月11号01点开始（疑点1：实际上我启动的时间是7月10号下午16点），然后接着往下看日志，没有异常，报错什么的，启动的时候一切正常，再往下看，突然发现日志时间变成7月10号20点多（疑点2：时间变正常了），然后就接着报错，regionserver shutdown（疑点3：为啥会挂掉）；

再看hadoop日志，hadoop的datanode日志写了大概54G的大小；

7月10号下午到11号凌晨，一直在给集群入数据；但是7月11号，看该节点的数据，没有写到这个节点上任何数据；

疑点1，2的解答：该节点配置的自动对时是凌晨4点多，根据日志的情况，当时的情况应该是这样的，服务器的实际时间是7月11号1点多，服务正常启动，然后服务器到7月11号4点后，发现时间不对，校准后变成7月10号20点多；这个时间间隔和我启动服务和服务进程shutdown的时间间隔基本一直；所以说日志的时间变化，疑点1，2得到解释；这个时间的变化，有硬件时钟和系统时钟的关系，可以度娘。应该找clock和date

疑点3的解答：应该是时间变化，zookeeper发现后，认为时间不对，认为regionserver有问题，然后退出；我这个节点不是leader也不是follower；

最终的疑点：

为啥时间不对，hbase可以启动起来；看hbase的源码，有个slave和master的时间检查，默认30S，不知道跨天的情况如何；待有环境重现；

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hbase奇怪问题现场

我新加了一个节点，大概是下午16点，然后各种配置做好，datanode启动，然后regionserver也启动，完事，今天早上过来看，这个节点regionserver挂掉了。datanode进程还在；然后看了regionserver的日志，发现hbase启动的时间是7月11号01点多；实际上我启动的时间是7月10号 16点多；然后接着往下看日志，没有类似的error什么的，启动正常，再往下看，发现
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。