CM agent 发送heartbeat给CM server 不断发生 connection refused:timed out

1、首先测试 cm agent 连接至 cm server 7182端口,看是否联通(是连通)

2、然后尝试 hard_restart agent 后依旧无法修复

3、观察到许多 hive bdr 依旧和 cm server 保持通信,开始怀疑是同步任务压力过大。强制停掉此agent后,kill 掉后台所有的hive进程,再启动这个 cm agent)

service cloudera-scm-agent next_stop_hard 
service cloudera-scm-agent stop 
ps -a | grep hive #找出hive进程号 
kill -9 [进程号]
service cloudera-scm-agent start

然后成功了,不再报错。

 

结论:由于跑了太多的hive replication,所以有好几个datanode挂了。需要hard stop,kill掉后台的hive进程后再重启。

已标记关键词 清除标记
©️2020 CSDN 皮肤主题: 编程工作室 设计师:CSDN官方博客 返回首页