linux 定时监控挂掉进程并重启

产生背景: 在 k8s 集群安装 SQLFlow 后, 每过一段时间 sqlflow-server、sqlflow-jupyter、argo-server 三个进程就会自己挂掉. (在 sqlflow 官网中也提到该问题, 说是 Kubernetes 内置逻辑,重新运行端口映射命令即可)

解决方式: 使用 shell 脚本, 定时每分钟检查三个进程是否挂掉, 若挂掉则重启, 否则输出 already started!

[root@dooo ~]# cd /sqlflow/shell/
[root@dooo shell]# cat restart.sh
#!/bin/sh

while true
do
  ps -ef | grep "deployment/sqlflow-server" | grep -v "grep"
  if [ $? -gt 0 ]
  then
  ./sqlflow-server.sh
  echo "sqlflow-server process has been restarted!"
  else
  echo "sqlflow-server process already started!"
  fi

  ps -ef | grep "deployment/sqlflow-jupyter" | grep -v "grep"
  if [ $? -gt 0 ]
  then
  ./sqlflow-jupyter-mysql.sh
  echo "sqlflow-jupyter process has been restarted!"
  else
  echo "sqlflow-jupyter process already started!"
  fi

  ps -ef | grep "deployment/argo-server" | grep -v "grep"
  if [ $? -gt 0 ]
  then
  ./argo-server.sh
  echo "argo-server process has been restarted!"
  else
  echo "argo-server process already started!"
  fi

sleep 60
done

ps -ef 找不到匹配项, $? > 0

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值