技术原理:
本次服务监控采用较为简洁且通用的方法,主要是利用了nmap的扫描技术。针对TCP服务,采用半开扫描技术来探测指定的TCP端口是否可达;针对UDP服务,仅采用普通UDP端口扫描技术来探测指定的UDP端口是否可达。以此来判断相应的服务是否正常。
相关工具:
# yum -y install nmap
监控脚本:
#!/bin/sh
#============================================================================================
# 通用TCP、UDP服务监控,且服务异常时自动拉起服务
#
# 前提条件:
# 服务启动采用标准的系统启动脚本【service 服务名 (start|stop|restart|reload|...)】
#
#============================================================================================
PATH=/sbin:/bin:/usr/sbin:/usr/bin:/usr/local/bin:/usr/local/sbin
[[ $# -ne 3 ]] && echo "$0 端口号 协议类型 服务名" && exit 1
SRV_PORT=$1 ##端口号
SRV_PROT=$2 ##协议类型
SRV_NAME=$3 ##服务名
## 是否已正确扫描
SCAN_FLAG=0
ETH1_ADDR=`/sbin/ifconfig eth1 | awk -F ':' '/inet addr/{print $2}' | sed 's/[a-zA-Z ]//g'`
TMP_SRV_PROT=`echo ${SRV_PROT} | tr '[A-Z]' '[a-z]'`
if [[ "${TMP_SRV_PROT}" == "tcp" ]]; then
PROT_OPT="S"
elif [[ "${TMP_SRV_PROT}" == "udp" ]]; then
PROT_OPT="U"
else
echo "未知的协议类型!" && exit 1
fi
## 最多扫描3次,成功一次即可,以避免网络抖动而导致误判
for ((i=0; i<3; i++)); do
RETVAL=`/usr/bin/nmap -n -s${PROT_OPT} -p ${SRV_PORT} ${ETH1_ADDR} | grep open`
[[ -n "${RETVAL}" ]] && SCAN_FLAG=1;break || sleep 10
done
if [[ ${SCAN_FLAG} -ne 1 ]]; then
TMP_SRV_NAME=`echo ${SRV_NAME} | tr '[A-Z]' '[a-z]'`
[[ ! -f /etc/init.d/${TMP_SRV_NAME} ]] && TMP_SRV_NAME="${TMP_SRV_NAME}d"
/sbin/service ${TMP_SRV_NAME} restart >/dev/null 2>&1
fi
#============================================================================================
##The End
使用样例(crontab信息):
*/2 * * * * /usr/local/haproxy/sbin/check_service.sh 80 tcp HAProxy >/dev/null 2>&1