linux进程监控重启shell脚本

本文主要内容:

  • shell日志date format
  • shell poll监控重新运行,挂了则重启程序

前段时间工作需要使用python+scrapy写了个新闻舆情爬虫系统,服务器上面跑了大概5个月,期间莫名其妙的挂了2~3次。最终决定使用shell一直监控指定的进程,如果没有运行,则重新启动重新。

相信监控重新是否运行,如果重新意外挂了,需要对重新重新启动这个场景应该十分常见吧,(下面是shell的log截图)
这里写图片描述
下面是shell脚本
下面的shell中test_process=”[p]ython.*nohup_restart_test_py” 之所以加上 [] [p]yth… 是为了不kill shell的本身的grep程序,当然一般会加上 grep -v grep来排除掉本身shell的grep, 但是我觉得加上[]更方便点

#!/bin/bash
#restart scrape news process if the process exited accidentally

log_file="restart_sh.log"

# return the current date time
TIMESTAMP(){
    echo $(date "+%Y-%m-%d %H:%M:%S")
}

stop_process_if_running(){
    # $1->process_name to grep
    echo $(ps -ef | grep $1)
    be_running=$(ps -ef | grep $1 | wc -l)
    if [ $be_running -gt 0 ]
    then
        echo "$(TIMESTAMP) $1 is running, T'm going to kill it"
        ps -ef | grep "$1" | awk '{print $2}' | xargs kill -9
        if [ $? -eq 0 ];
        then
            echo "kill $1 successfully!!!"
        fi
    else
        echo "$(TIMESTAMP) $1 is not running"
    fi
}

restart_process_if_die(){
    # $1->process_name by grep, $2->python directory
    # $3->process python file name
    echo "paras is: $@"
    be_running=$(ps -ef | grep $1 | wc -l)
    if [ $be_running -eq 0 ];
    then
        echo "$(TIMESTAMP) $3 got down, now I will restart it" | tee -a $log_file
        cd $2
        echo "Now I am in $PWD"
        nohup python $3 & 2>&1
        if [ $? -eq 0 ];
        then
            echo "$(TIMESTAMP) $3 restart successfully" | tee -a $log_file
        fi
        cd -
    else
        echo "$(TIMESTAMP) $3 is running, no need to restart"
    fi
}

test_process="[p]ython.*nohup_restart_test_py"
file_dir=/home/xiongyu/search_start_sh/
py_file=nohup_restart_test_py.py
#when execute this shell script, if the process is running,kill it firstly
stop_process_if_running $test_process

# poll if the process is died, if got died then restart it.
while :
do
    restart_process_if_die $test_process $file_dir $py_file
    echo "$(TIMESTAMP) now I will sleep 10S"
    sleep 10
done
  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
### 回答1: Linux进程守护shell脚本是一种用于监控和管理进程脚本。它可以在后台运行,定期检查进程是否存在,如果进程不存在,则自动重启进程。这种脚本通常用于服务器上的长期运行的进程,如Web服务器、数据库服务器等。它可以确保这些进程在意外崩溃或异常退出时能够自动重启,保证服务器的稳定性和可靠性。 ### 回答2: 进程守护是指在Linux环境下,用一个脚本监控一个程序,如果程序意外中断或崩溃,脚本会自动重新启动这个程序,确保它一直运行。 Linux进程守护shell脚本通常有两种实现方式。 第一种方式是通过bash语法实现。具体步骤如下: 1. 在shell脚本中定义一个死循环,用来监控目标进程的运行状态。 2. 使用ps命令来获取进程的PID(进程号),判断目标进程是否存在。 3. 如果目标进程不存在,则重新启动它。 4. 为了防止出现过多的子进程,可以使用wait命令等待目标进程的退出,然后再启动新的进程。 5. 在脚本中加入相关日志记录,便于后续排查问题。 第二种方式是通过守护进程实现。具体步骤如下: 1. 编写一个守护进程,用于监控目标进程。 2. 将目标进程的启动、停止等命令交给守护进程来管理。 3. 在守护进程中加入监控逻辑,如程序崩溃后自动重启,使用pidfile(进程ID)避免出现多个实例等。 4. 设置守护进程为系统服务,可以在系统启动时自动运行。 无论使用哪种方式, Linux进程守护shell脚本都是确保系统稳定性的重要手段。通过对关键进程的实时监控,它可以及时发现并恢复故障,从而避免因错误导致的服务中断和数据丢失等问题,提高服务的可靠性。 ### 回答3: Linux进程守护是指在Linux系统中运行一个程序,并让该程序始终在后台运行并保持稳定状态。为了实现这样的守护操作,我们可以使用shell脚本来完成。下面就来探讨一下如何编写Linux进程守护shell脚本。 首先,我们需要使用一个while循环来不断监控程序是否在后台运行。在这个循环中,我们可以使用ps命令来获取正在运行的程序进程ID,并将其存储在一个变量中。当程序停止运行时,该变量将被清空,以便我们能够重新启动该程序。 为了实现程序的自启动功能,我们可以在程序中使用nohup命令。nohup可以让程序运行在后台,即使在当前shell退出时也能继续运行,并将程序输出重定向到一个文件中。在shell脚本中,我们可以使用nohup,将程序执行的命令行参数放入一个子shell中,并将该子shell的输出重定向到一个文件中。 另外一个需要考虑的因素是程序异常退出的情况。如果程序崩溃或被意外终止,则需要能够及时重新启动程序。为了实现这个目标,我们可以使用一些诸如traps和signals这样的技术。这些技术可以让我们在程序崩溃时自动重新启动程序。 最后还需要考虑如何将脚本编写成一个系统服务,以便其能够随系统启动而启动。为了实现这个目标,我们需要为脚本编写一个init脚本,并将其放到/etc/init.d目录中。在这个脚本中,我们可以定义启动和停止脚本的命令,并将这些命令添加到Linux系统的服务管理器中。 综上所述,要编写一个Linux进程守护的shell脚本,需要通过while循环、nohup命令、traps和signals等技术来实现程序的自启动和异常重启,并需要编写一个init脚本脚本转换为系统服务。这样一来,我们就能够让程序始终在后台运行,保持系统的稳定和安全。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值