HMaster启动选主超时，长时间没有master服务

最新推荐文章于 2023-04-28 15:03:27 发布

`青冘`

最新推荐文章于 2023-04-28 15:03:27 发布

阅读量598

点赞数

分类专栏：大数据文章标签：大数据 hadoop hbase

本文链接：https://blog.csdn.net/weixin_44154134/article/details/107365467

版权

大数据专栏收录该内容

2 篇文章 0 订阅

订阅专栏

1.现象描述
集群修改参数后，需要对hbase服务进行重启操作，发现重启后master一直未选主成功

2.原因分析

查看hbase-master日志,发现日志一直在刷如下日志：
查看/hbase/MasterProcWALs/下的日志文件及大小，发现日志文件差不多共112W个，日志大小约4.5T

hadoop fs -ls /hbase/MasterProcWALs/
hadoop fs -du -s -h /hbase/MasterProcWALs

master在选主过程中会回放MasterProcWAL日志，因日志文件太多，导致选主时间过长

3.解决方式

将MasterProcWAL日志文件mv到其他地方，并重启服务，选主成功

su hdfs
hadoop fs -mkdir /user/hadoop/MasterProcWALs
hadoop fs -mv /hbase/MasterProcWALs/* /user/hadoop/MasterProcWALs

集群可设置一个定时清理MasterProcWAL日志的脚本，避免出现相同的问题

hadoop fs -rm -r /hbase/MasterProcWALs/*

参考链接：
https://cloud.tencent.com/developer/article/1349438

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

`青冘`

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Performing High Availability for HBase Using Apache Zookeeper

程序员光剑

08-02

679

本文将深入讨论Apache HBase的高可用性保障方案——Apache Zookeeper。HBase是一个分布式NoSQL数据库，本文对HBase进行Zookeeper结合保障其高可用性的过程及实践经验给出展开。

hbase占用内存过高_HBase——系统调优

weixin_39846089的博客

12-20

628

JVM层HMaster 没有处理过重的负载，并且实际的数据服务不经过 HMaster，它的主要任务有2个：一、管理Hbase Table的 DDL操作，二、region的分配工作，任务不是很艰巨。但是如果采用默认自动split region的方式，HMaster会稍微忙一些，负载不大，可适度对此进程做适量放大heap 的操作，但不可太大。RegionServer在写入数据时，数据会先保存在mem...

参与评论您还未登录，请先登录后发表或查看评论

hbase主节点HMaster启动失败等问题

liwenjie001的博客

05-26

7533

一、hbase shell错误运行hbase shell的list时报错： hbase(main):001:0> list ERROR: Can't get master address from ZooKeeper; znode data == null Here is some help for this command: List all tables in hb...

Hbase 操作表时，连接超时，或者找不到对应的region Server

萌兔兔MMQ！！

09-15

2134

在Hbase操作表时，突然报出ERROR: Failed 1 action: NotServingRegionException: 1 time, servers with issues: hadoop104,16020,1584783879148, 而且在flush时，会报错TimeoutException: Timeout elapsed! Source:Timeout caused Foreign Exception Start:1584783789686, End:1584783849687, d

HBase-客户端-超时机制设置

鲸鱼写程序的专栏

05-10

2441

背景当用户有一些大请求的时候，会报超时，但是用户觉得请求慢一些也能接受，如何设置？如果用户觉得HBase默认超时时间太长，希望请求超过一定毫秒数就报超时退出来，而不是一直在等待，如何设置？入手从网上搜索可以看到很多有关hbase客户端超时设置的参数说明不过并不是非常详细不过至少我们能定位到这几个参数，以进行入手 hbase.rpc.time...

Hbase超时机制

La victoria的博客

11-05

979

配置优化 zookeeper.session.timeout 默认值：3分钟（180000ms）说明：RegionServer与Zookeeper间的连接超时时间。当超时时间到后，ReigonServer会被Zookeeper从RS集群清单中移除，HMaster收到移除通知后，会对这台server负责的regions重新balance，让其他存活的RegionServer接管.调优：...

hbase 客户端超时、重连设置

menghuannvxia的专栏

12-09

3438

1.设置的目的由于作为在线服务,需要能够保证在快速失败、失败容错重试等特性。快速失败能保证系统的低延时,能防止因为等待某个资源，造成服务资源暂用,最后导致服务不可用。失败容错能够提供服务的稳定性,进行服务失败是重试。因此Hbase客户端提供的重试机制，并通过配置合理的参数使得客户端在保证一定容错性的同时还能够保证系统的低延迟特性。 2.hbase客户端重要参数 hbas

【Elasticsearch选主流程】

热门推荐

来啦，老弟~

05-15

4万+

Reference

关于Hbase的shell客户端list_namespace时出现Master is initializing问题以及一键关闭Hbase命令等待超时的解决方法

wow_is_nothing的博客

08-28

1689

问题出现原因：可能由于集群的机器时间不同步时，盲目的开启hbase造成的。此外，集群机器时间不同步，还会导致集群开启异常，比如，开启的节点个数变少以及Hmaster节点启动一段时间后自动关闭等问题。 hbase(main):001:0> list_namespace NAMESPACE ERROR: org.a...

HBase 0.99 源代码分析 - Master启动过程(2)

chicm的专栏

11-06

1723

下面继续从HMaster.finishActiveMasterInitialization方法开始分析HBase 0.99 Master启动过程。HMaster.finishActiveMasterInitialization方法主要完成如下功能： 1. 初始化Master功能组件：filesystem manager, server manager, assignment manager, r

Hbase各节点的RegionServer和HMaster启动失败

LZX的博客

10-21

626

问题描述：重启Hbase RegionServer和Hmaster失败查看主、从节点日志后发现如下报错 2019-10-05 19:52:05,801 ERROR [main] regionserver.HRegionServerCommandLine: Region server exiting java.lang.RuntimeException: HRegionServer Aborte...

hbase windows 单机安装_大数据 Hbase 笔记大全收藏+关注+转发

weixin_39785422的博客

11-29

339

一、概述https://hbase.apache.org/HDFS：Hadoop分布式文件系统，适合非结构化数据的存储以及读写访问；Apache HBase建立在HDFS之上的分布式、基于列存储的非关系型数据库；具有可靠、稳定、自动容错、多版本等特性；HBase实际上是Google BigTable项目的开源实现，它适合海量大规模(数十亿行、数百万列)的结构化数据存储；当需要随机、实时读写访问大数...

HBase高可用HMaster进入Active状态重复重启失败，由MasterProcWals状态日志过多导致Master重复失败

haoheiao的博客

08-15

1132

CDH下服务角色列表Hbase中没有Active的Master；集群告警提示 “未见活动的Master”；Hbase的Master WebUI中查看Current Active Master主机,实际状态为 “backup”；Hbase节点 /var/log/hbase/ 目录下查看日志；报错信息：FileSystem closed。...

sqlserver执行了drop table 恢复没有备份_HBase1.x进阶：数据表(不只数据)误删除，快速恢复(已生产实践)...

weixin_39880615的博客

12-01

428

微信公众号：大数据开发运维架构关注可了解更多大数据相关的资讯。问题或建议，请公众号留言;如果您觉得“大数据开发运维架构”对你有帮助，欢迎转发朋友圈作为Hadoop集群维护人员，经常误操作直接将HBase表数据误删除，生产数据肯定是不能直接删除的，下面我详细给大家演示下，如何快速恢复误删除的表：为方便大家理解，我先讲一下HBase在hdfs上的目录结构，先看下面这张图：一共9个目录和2个文件：目录：...

hbase 设置超时参数

qq_22498427的博客

04-28

2121

hbase设计的目标是成为一个高可用集群，能够在失败的时候快速响应，当出现网络抖动等偶发情况时，能快速重试，让用户可以快速拿到结果。而不是一直卡着，使得上层应用阻塞等待。这个功能可以通过设置下面的3个超时参数、超时重试次数来实现。在超时的时候，立即主动断开，并重试。可以在当前集群上重试，也可以切换集群重试。

hadoop和Hbase日志位置

qq_33366098的博客

08-12

1万+

重要日志的位置( <user>是启动服务的用户，<hostname> 是机器的名字) NameNode: $HADOOP_HOME/logs/hadoop-<user>-namenode-<hostname>.log DataNode: $HADOOP_HOME/logs/hadoop-<user>-datanode-<host...

Hbase服务故障恢复后快速解决region负载不均衡的问题

jingyi1219的博客

04-12

2118

此解决方案的适用场景： hbase故障前region平均的分布在所有的regionserver上面，故障发生后，HbaseMaster挂掉，部分或全部regionserver挂掉，当hbase个组件都恢复后，会发现大量的region是在少数regionserver上，如果你集群开启了region自动均衡，需要等待特别长的时间，特别是hbase集群规模很大时，比如我们一个项目的hbase集群有200个regionserver，region数目达到了10W+，如果要等hbase自己让region负载均衡，需要

hbase参数调整

测试工程师Eric的路...

05-07

2754

简单的参数调整，适合初级学习 1.hbase中hfile的默认最大值(hbase.hregion.max.filesize) 256MB --10GB？？根据结果得到如下结论：值越小，平均吞吐量越大，但吞吐量越不稳定；值越大，平均吞吐量越小，吞吐量不稳定的时间相对更小。 2. autoflush=false的影响 2M(hbase.client.write.buffer决

hbase/hadoop异常：No lease on /hbase/archive/data/... File is not open for writing

刘本龙的专栏

11-21

2301

问题描述我在进行hbase快照拷贝时报了以下错误： ./hbase org.apache.hadoop.hbase.snapshot.ExportSnapshot -snapshot "MODEL.THIRD_PARTY_KV-11211752-snapshot" -copy-from hdfs://fromIP:9000/hbase -copy-to hdfs://toIP:9000/hbas...

HMaster 启动 meta 表分配