自动化监控spark进程并重启

自动化监控spark进程并重启,实际生产中可能会出现服务进程挂掉的异常,自动监控与重启是非常重要。


1、监控主节点的shell脚本

#!/bin/bash
#
master=`ps -ef | grep Master | grep spark | awk '{print $2}'`
echo $master

if [ "$master" =  "" ]; then
        echo "Spark Master is restart!"
        /opt/modules/spark/sbin/stop-master.sh
        /opt/modules/spark/sbin/start-master.sh
else
        echo "Spark Master is alive!"
fi

2、监控从节点的shell脚本

#!/bin/bash
#
slave=`ps -ef | grep Worker | grep spark | grep 7077 | awk '{print $2}'`
echo $slave

if [ "$slave" =  "" ]; then
        echo "Spark Worker is restart!"
        /opt/modules/spark/sbin/stop-slave.sh
        /opt/modules/spark/sbin/start-slave.sh spark://10.130.2.20:7077
else
        echo "Spark Worker is alive!"
fi

3、加入crontab的定时

*/1 * * * * /opt/bin/monitorSparkSlave.sh

每分钟监控一次,如果服务进程不存在,则重启该服务。

注意重启slave节点时,需要指定master的ip

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值