Hbase 线上集群 OutOfMemory 性能优化

Joshua_2019

已于 2023-01-17 17:12:40 修改

阅读量842

点赞数

分类专栏：大数据文章标签： hbase 性能优化大数据

于 2022-07-01 13:32:08 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39338423/article/details/125421095

版权

线上HBase集群在大数据写入时频繁遭遇OutOfMemory错误。通过了解HBase数据存储机制和compaction机制，针对磁盘IO和内存写入性能进行参数优化，包括调整`hbase.regionserver.handler.count`、`hbase.client.write.buffer`等。增加RegionServer节点数量至10台，关闭自动Major Compaction，改为手动触发，并结合业务层面对写入流量进行管控，有效降低了OutofMemory错误的发生。

摘要由CSDN通过智能技术生成

线上状况

服务器信息

本人使用的各组件版本如下：
操作系统版本：centos7
CM版本：6.3.1
CDH版本：6.3.2（5.16.2版本实测也可以）
JDK版本：openjdk version “1.8.0_262”

服务器配置：

服务器	CPU	内存	磁盘
cmserver	8核	24G	/home/app 挂载300G
master01	4核	24G	/home/app 挂载300G
master02	4核	24G	/home/app 挂载300G
slave01	4核	24G	/home/hdfsdata/data1 挂载50T
slave02	4核	24G	/home/hdfsdata/data1 挂载50T
slave03	4核	24G	/home/hdfsdata/data1 挂载50T
slave04	4核	24G	/home/hdfsdata/data1 挂载50T

注意：salve节点合理的内存配置是32G，这里写的24G是参数调整之前的配置。

线上的hbase集群运行时发现，当数据量写入比较大时，经常会报：OutOfMemory errors 的错误
报错截图如下：
在这里插入图片描述

报错时的集群负载情况如下：
HDFS写入情况如下，集群连续几天处于高负荷状态，每个DataNode平均读写总量约为200M/s。
在这里插入图片描述

集群网络IO情况如下，各网络接口中的总传送的字节数约为187M/s，各网络接口中的总接收的字节数约为232M/s。
在这里插入图片描述

可以看到，一天时间内，RegionServer 多次因内存不足而退出。
在这里插入图片描述

各RegionServer 的web响应时间如下，从图中可以看出响应时间有一定的波动，并且跟上图 RegionServer 因内存不足而退出在时间上是相对应的，当发生因内存不足而退出时，web响应时间也变的很高，会导致客户度读写超时。
在这里插入图片描述

Region Server占用的内存如下，基本稳定在4G左右，因为配置的最大内存就是4G。在发生因内存不足而退出的时间点上，驻留内存会有一些的降低。
在这里插入图片描述

hbase数据存储机制

要对HBASE集群进行调优之前，需要先了解HBASE的数据存储机制。

hbase compaction机制

hbase compaction参考文章：
https://blog.csdn.net/u011598442/article/details/90632702

Compaction机制的由来
HBase基于LSM-Tree（Log-Structured Merge Tree&#x

最低0.47元/天解锁文章

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Joshua_2019 CSDN认证博客专家 CSDN认证企业博客

码龄7年

31: 原创

53万+: 周排名

215万+: 总排名

7万+: 访问

: 等级

522: 积分

27: 粉丝

34: 获赞

50: 评论

253: 收藏

私信

关注

热门文章

分类专栏

大数据 7篇
Android 3篇
微服务 5篇
Java 5篇
数据库 6篇
物联网 1篇
Linux 7篇
消息/缓存 2篇
工具类 3篇

最新评论

CDH6.3安装问题汇总
hongdounuoyan: 那请问 supervisord服务需要用，怎么办？拆东墙补西墙？
Cloudera Manager6.3.1+CDH6.3.2本地仓库方式搭建（超详细版）
baidu_30400821: 安装包麻烦发一下，谢谢
IDEA2022搭建Spring Cloud多模块项目
浮生若水422: 你好还想问下最近面试好多大厂都鄙视spring cloud gateway。。。说性能一般 GC时还会丢包啥的...但是除了spring cloud gateway ,spring cloud alibaba又没有给出其他的网关方案。。。然后openfeign 对方也说在高GVing发下这个是玩具。。。openfeign只能换成dubbo性能才会更好吧？
IDEA2022搭建Spring Cloud多模块项目
Joshua_2019: api模块是给其它内部应用提供微服务接口的，可以通过dubbo或者OpenFeign等方式暴露接口。 integration模块统一收集调用外部服务的代码，可以接入自己内部应用提供的微服务接口或者外部厂商提供的接口。主要是调用外部服务，不是提供服务，不需要暴露在最外层给其它应用访问。这个只是推荐的模块依赖关系，可以按照自己的业务需求划分不同模块之间的边界。
IDEA2022搭建Spring Cloud多模块项目
浮生若水422: api模块：负责对其它微服务系统提供接口，不允许抛异常，返回的结果统一使用BizResult封装；是指微服务内部每个子服务的通讯？ integration模块：负责外部系统的对接，如其他内部微服务应用、微信接入、支付宝接入等，直接返回外部系统的领域模型，上层自行绝对是否需要再做进一步封装；是指跟系统第三方通讯？那这不应该和api一样暴漏在最外层吗？看你的画图不是啊。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。