解决集群长时间运行后无法正常关闭问题

解决集群长时间运行后无法正常关闭问题

背景

  • 当前配置:hadoop版本为3.1.3
  • 我的集群运行了好几个月,因为业务数据的增长,之前的资源配置方案需要调整,当我修改了yarn-site.xml分发之后,使用stop-yarn.sh命令停止yarn时发现并没有停止yarn
  • 于是我将当前任务全部关闭,然后打算stop-all.sh关闭整个集群,竟然还是无法关闭,仿佛关闭命令不起作用

问题原因

因为linux默认会30天清理一次/tmp临时文件,而集群配置文件hadoop-env.sh中的默认pid存储位置就在这里,这就造成了因集群长时间运行后,无法正常找到集群的pid

vim $HADOOP_HOME/etc/hadoop/hadoop-env.sh
# Where pid files are stored.  /tmp by default.
#export HADOOP_PID_DIR=/tmp

解决方案

  1. 首先确保所有有关hadoop的任务全部关闭
  2. 使用jps查看集群的进程号
  3. 手动kill掉他们
  4. 修改hadoop-env.sh,制定pid保存在一个不会被清理的位置
  5. pid的位置记得修改其写入的权限才可以
  6. 重启集群即可
  • 3
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值