第七课 Shell脚本编程-大型脚本工具开发实战

第七课 Shell脚本编程-大型脚本工具开发实战

第一节 需求描述

  1. Supervisor是用Python开发的一套通用的进程管理程序,能将一个普通的命令行进程变为后台daemon,并监控进程状态,异常退出时能自动重启。它是通过fork/exec的方式把这些被管理的进程当作supervisor的子进程来启动,这样只要在supervisor的配置文件中,把要管理的进程的可执行文件的路径写进去即可。也实现当子进程挂掉的时候,父进程可以准确获取子进程挂掉的信息的,可以选择是否自己启动和报警。supervisor还提供了一个功能,可以为supervisord或者每个子进程,设置一个非root的user,这个user就可以管理它对应的进程。
  2. 需求描述
    • 实现一个脚本工具,该脚本提供类似supervisor功能,可以对进程进行管理;
    • 一键查看所有进程运行状态
    • 单个或批量启动进程,单个或批量停止进程
    • 提供进程分组功能,可以按组查看进行运行状态,可以按组启动或停止该组内所有进程
  3. 主要功能函数列表:
function get_all_process # 返回进程名称列表字符串
function get_all_group # 返回进程组列表字符串
# 返回进程详细信息列表字符串,详细信息包括:运行状态、PID、CPU、MEM、启动时间 注:该函数可以接收一个参数,参数为进程名称
function get_process_info 
# 返回进程组内的所有进程名称列表字符串 例子:DB组–>“mysql postgresgql oracle”
function get_all_process_by_group 

第二节 脚本的特殊参数

  1. 在linux系统中有很多的特殊符号,他们具有特殊的意义
    • $# 是传给脚本的参数个数
    • $0 是脚本本身的名字
    • $1 是传递给该shell的第一个参数
    • $2 是传递给该shell的第二个参数
    • $@ 是传递给脚本的所有参数的列表
    • $ 是以一个单字符串显示所有向脚本传递的参数,与位置变量不同,参数可超过9个*
    • $$ 是脚本运行的当前进程ID号
    • $?是显示最后命令退出的状态,0表示没有错误,其他表示有错误
#!/bin/bash
echo "param num:$#"
echo "sh name is :$0"
echo "The first param is :$1"
echo "The second param is :$2"
echo "The all param list is :$@"
echo "The all param str is :$*"
echo "The PID is:$$"
echo "The precomm stat is:$?"

第三节 功能函数的实现

# process.cfg
[GROUP_LIST]
WEB
DB
HADOOP
YARN

[WEB]
nginx
httpd

[DB]
mysql
postgresql
oracle

[HADOOP]
datanode
namenode
journalnode

[YARN]
resourcemanager
nodemanager

[nginx]
description="Web Server 1"
program_name=tail
parameter=-f /root/lesson/9.1/tmp/web-nginx.conf

[httpd]
description="Web Server 2"
program_name=tail
parameter=-f /root/lesson/9.1/tmp/web-httpd.conf

[mysql]
description="High Performance DataBase"
program_name=tail
parameter=-f /root/lesson/9.1/tmp/mysql.conf 

[postgresql]
description="PG Server"
program_name=tail
parameter=-f /root/lesson/9.1/tmp/postgresql.conf

[oracle]
description="The Best DB Server In The World"
program_name=tail
parameter=-f /root/lesson/9.1/tmp/oracle.conf

[datanode]
description="NODE: Storage Data For HDFS"
program_name=tail
parameter=-f /root/lesson/9.1/tmp/hdfs-datanode.xml

[namenode]
description="NODE: Storage MetaData For HDFS"
program_name=tail
parameter=-f /root/lesson/9.1/tmp/hdfs-namenode.xml

[journalnode]
description="Data synchronization For NameNode"
program_name=tail
parameter=-f /root/lesson/9.1/tmp/hdfs-journalnode.xml

[resourcemanager]
description="Resource allocation, task scheduling"
program_name=tail
parameter=-f /root/lesson/9.1/tmp/yarn-resourcemanager.xml

[nodemanager]
description="Compute nodes to perform tasks assigned by RM"
program_name=tail
parameter=-f /root/lesson/9.1/tmp/yarn-nodemanager.xml
  1. function get_all_group说明:该函数无需输入任何参数;返回配置文件 process.cfg中所有的组信息,例如WEB、DB等。
function  get_all_group
{
	if [ ! -e $HOME_DIR/$CONFIG_FILE ];then
		echo "CONFIG_FILE is not exist .. PLease CHeck.."
		EXIT 1
	else
		G_LIST=$(sed -n '/\[GROUP_LIST\]/,/\[.*\]/p' process.cfg | egrep -v "(^$|\[.*\])")
		echo "$G_LIST"
	fi
}

# 测试一下
# groups=`get_all_group`
# echo $groups
# for g in `get_all_group`
# do 
#   echo $g
# done 
  1. function get_all_process: 说明:该函数无需输入任何参数;返回配置文件 process.cfg中所有的进程信息。
function get_all_process
{
	for g in `get_all_group`
	do 
		P_LIST=`sed -n "/\[$g\]/,/\[.*\]/p" process.cfg | egrep -v '^$|\[.*\]'`
		echo $P_LIST
	done
}
  1. function get_process_info
    • function get_process_pid_by_name说明:该函数接收一个参数,参数为进程名称;返回值是一个PID的列表,可能有一个PID,也可能有多个
    • function get_process_info_by_pid说明:该函数接收一个参数,参数为进程PID;返回值是一个进程运行信息的列表,列表包含运行状态、CPU占用率、内存占用率、进程启动时间
    • $@:表示所有脚本参数的内容 $#:表示返回所有脚本参数的个数。
function get_process_pid_by_name 
{
	if [ $# -ne 1 ];then
		return 1
	else 
		pids=`ps -ef | grep $1 | grep -v grep | grep -v $0| awk '{print $2}'`
		echo $pids
	fi
}

function get_process_info_by_pid
{
	if [ `ps -ef | awk -v pid=$1 '$2==pid{print}' | wc -l` -eq 1 ] ;then
		pro_status="RUNNING"
	else
		pro_status="STOPED"
	fi
	pro_cpu=`ps aux | awk -v pid=$1 '$2==pid{print $3}'`
	pro_mem=`ps aux | awk -v pid=$1 '$2==pid{print $4}'`
	pro_start_time=`ps -p $1 -o lstart | grep -v STARTED`
}
  1. function is_group_in_config说明:该函数接收一个参数,参数为组的名称;返回值是0或1,0代表该组在配置文件中,1代表该组不在配置文件中
function is_group_in_config
{
	for gn in `get_all_group`;do
		if [ $gn = $1 ];then
			return
		fi
	done
	echo "Group $1 is not in process.cfg"
	return 1
}
  1. function get_all_process_by_group说明:该函数接收一个参数,参数为组名称;返回值是对应组内的所有进程名称列表
function is_group_in_config
{
	for gn in `get_all_group`;do
		if [ $gn = $1 ];then
			return
		fi
	done
	return 1

}

function get_all_process_by_group
{
	is_group_in_config $1

	if [ $? -eq 0 ];then
		p_list=`sed -n "/\[$1\]/,/\[.*\]/p" process.cfg | egrep -v "(^$|\[.*\])"`
		echo $p_list
	else
		echo "GroupName $1 is not in process.cfg"
	fi
		
}
  1. function get_group_by_process_name说明:该函数接收一个参数,参数是一个进程名称;返回值是一个组名

function get_group_by_process_name
{
	for gn in `get_all_group`;do
		for pn in `get_all_process_by_group $gn`;do
			if [ $pn == $1 ];then
				echo "$gn"
			fi 
		done	
	done
}
  1. function format_print说明:该函数接收二个参数,第一个参数为process_name,第二个参数为组名称返回值,是针对每一个进程PID的运行信息
function format_print	 
{
	ps -ef | grep $1 | grep -v grep | grep -v $this_pid &> /dev/null
	if [ $? -eq 0 ];then
		pids=`get_process_pid_by_name $1`
		for id in $pids;do
			get_process_info_by_pid $id
			awk -v p_name=$1 \
					-v g_name=$2 \
					-v p_status=$pro_status \
					-v p_cpu=$pro_cpu \
					-v p_mem=$pro_mem \
					-v p_start_time=$pro_start_time 
					'BEGIN{printf "%-10s%-10s%-5s%-5s%-5s%-5s%-15s\n",p_name,g_name,p_status,p_cpu,p_mem,p_start_time}'
		done
	else
		awk -v p_name=$1  -v g_name=$2 'BEGIN{printf "%-10s%-10s%-5s%-5s%-5s%-5s%-15s\n",p_name,g_name,"NULL","NULL","NULL","NULL","NULL"}'
	fi	
			
}
  1. function is_process_in_config说明:该函数接收一个参数,参数为进程名称;返回值是0或1,0代表该进程在配置文件中,1代表进程不在配置文件中
function is_process_in_config
{
	for pn in `get_all_process`;do
		if [ $pn = $1 ];then
			return
		fi
	done
	echo "Process $1 is not in process.cfg"
	return 1	
}

第四节 程序主流程设计及代码实现

  1. ./app_status.sh 执行有三种情况:
    • 无参数 列出配置文件中所有进程的运行信息
    • -g GroupName 列出GroupName组内的所有进程
    • process_name 列出指定进程的运行信息
  2. shift命令每执行一次,变量的个数($#)减一(之前的$1变量被销毁,之后的$2就变成了$1),而变量值提前一位。
if [ ! -e $HOME_DIR/$CONFIG_FILE ];then
	echo "CONFIG_FILE is not exist .. PLease CHeck.."
	exit 1
fi


awk 'BEGIN{printf "%-16s%-10s%-10s%-10s%-10s%-10s%-20s\n","ProcessName---","GroupNmae---","Status---","Pid----","Cpu-----","Memory---","StartTime---"}'


if [ $# -gt 0 ];then
	if [ "$1" == "-g" ];then
		shift # 把-g移走
		for gn in $@;do
			is_group_in_config $gn || continue
			for pn in `get_all_process_by_group $gn`;do
				is_process_in_config $pn && format_print $pn $gn
			done
		done
	else
		for pn in $@;do
			gn=`get_group_by_process_name $pn`
			is_process_in_config $pn && format_print $pn $gn
		done
	fi
else
	for pn in `get_all_process`;do
		gn=`get_group_by_process_name $pn`
		is_process_in_config $pn && format_print $pn $gn
	done
fi
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值