CDH修改静态资源池配置,NodeManager重启失败问题

hcq_lxq

已于 2023-04-24 13:33:28 修改

阅读量1.5k

点赞数

分类专栏：大数据/HDFS/CDH/sqoop 文章标签： sql hdfs hadoop

于 2021-11-30 17:49:35 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hcq_lxq/article/details/121638809

版权

大数据/HDFS/CDH/sqoop 专栏收录该内容

17 篇文章 0 订阅

订阅专栏

问题描述：

修改静态资源池配置的时候，重启整个CM之后，突然发现一个YARN中的NodeManager重启失败，问题NodeManager服务不能重启也不能停止。通过链接（http://hadoopip:8088/cluster/nodes）发现问题节点资源配置还是以前的配置。

感觉是CDH的BUG，后期集群出现某个节点的DataNode 显示繁忙，重启繁忙节点的DataNode失败，如下报错

Cannot resart service when DataNode (hadoopap025) is in BUSY state.

后来也是通过修改数据库的roles表后重启。

解决方案：

具体原因未知，感觉这个属于CDH的一个bug,如下是解决方案：在元数据库把有问题的数据状态更新，更新后重启问题节点即可。
1、重启有问题的agent，
systemctl restart cloudera-scm-agent
2、在元数据库的CM用户下查询roles表，查找role_type不是RUNNING的那条数据，更新这条数据为RUNNING
select * from roles t where t.role_type = 'NODEMANAGER';
update roles t
set t.configured_status = 'RUNNING'
where t.role_type = 'NODEMANAGER'
and t.configured_status = 'STARTING'
3、回到CM界面重启有问题的NodeManager即可。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
CDH修改静态资源池配置,NodeManager重启失败问题

问题描述：修改静态资源池配置的时候，重启整个CM之后，突然发现一个YARN中的NodeManager重启失败，问题NodeManager服务不能重启也不能停止。通过链接发现资源配置有一台还是以前的配置没有变化;http://hadoopip:8088/cluster/nodes解决方案：1、重启有问题的agent，systemctl restart cloudera-scm-agent2、在元数据库的CM用户下查询roles，查找role_type不是RUNNING的数据，更新这条数...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。