hadoop集群的datanode负载高问题的排查过程记录

最新推荐文章于 2023-02-28 21:43:40 发布

weixin_34150224

最新推荐文章于 2023-02-28 21:43:40 发布

阅读量863

点赞数

文章标签：大数据 java

原文链接：https://my.oschina.net/qzhli/blog/1832541

版权

为什么80%的码农都做不了架构师？>>>

通过cloudera manager界面发现线上hadoop环境的某一个datanode节点load average 过高（>160）和cpu利用率过高（>90），top发现绝大部分为lqz（此处已脱敏）的进程在占据cpu和负载，如下截图：

使用如下命令查看具体是哪些java进程

jps -mlv |grep lqz # 此处已进行脱敏

经查发现大部分为org.apache.hadoop.hive.cli.CliDriver，共计40个进程

$ /usr/java/default/bin/jps -mlv | grep org.apache.hadoop.hive.cli.CliDriver | wc -l
40

使用如下命令，定位出这些java进程都在执行hive -e hql

ps -ef

结合开发分析后，这些java进程进行细颗粒度分区建立操作，调整代码后，机器的负载恢复正常值。

另外，同时在该机负载过高的状态下，cloudera manager 界面显示该节点报“DataNode Pause Duration”，该状态也是间接反映出该节点资源吃紧的问题。

转载于:https://my.oschina.net/qzhli/blog/1832541

weixin_34150224

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
hadoop集群的datanode负载高问题的排查过程记录

为什么80%的码农都做不了架构师？>>> ...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。