1、supervisor 解决什么问题
我们的每台服务器都可能需要运行好几个进程,比如一个服务器往往同时存在nginx、php-fpm多个进程,对于执行定时任务的机器则往往会同时运行多个cli进程任务,如果使用命令行方式一个一个去手动启动和停止显然非常麻烦、低效,而且任务如果异常退出、每次都靠人工去重启也不现实,另外查看每个进程的状态也很不方便。Supervisord工具就是用来管理每台机器上多个进程的,与Supervisord类似的工具包括monit, daemontools和runit。
2、supervisor介绍
总结来说,Supervisor 是用Python开发的一套通用的进程管理程序,能将一个普通的命令行进程变为后台daemon,并监控进程状态,自动重启异常退出的进程,同时提供了命令行程序和web界面用于查看、管理进程。
Supervisor在大多数类Unix系统都可以正常工作,包括Linux,Mac OS X 和Solaris(10 for Intel)和FreeBSD 6.1,但是不支持 Windows平台。
网上一些资料显示Supervisor 只能在Python 2下运行,但实际上最新版本的Supervisor已经支持Python 3,要求>= Python 3.4。
官方网站
http://supervisord.org/
3、supervisor安装
mac 安装命令如下
brew install supervisor
启动supervisor
brew services restart supervisor
从启动supervisor的输出可以看到,使用的配置文件如下
/opt/homebrew/etc/supervisord.conf
该配置文件显示,会从 /opt/homebrew/etc/supervisor.d/ 中读取 .ini配置文件,管理相关的进程任务
使用-c参数可以指定主配置文件
/opt/homebrew/bin/supervisord -c /opt/homebrew/etc/supervisord.conf
关闭、重启命令
关闭supervisor
brew services stop supervisor
4、supervisor配置
配置可以分成两类 supervisord.conf 配置 和 子进程配置
4.1 supervisord.conf 配置
[unix_http_server]
file=/tmp/supervisor.sock #UNIX socket 文件,supervisorctl 会使用
chmod=0700 #socket文件的mode,默认是0700
chown=nobody:nogroup #socket文件的owner,格式:uid:gid
username=user # 认证账户
password=123 # 认证密码
[inet_http_server] #HTTP服务器,提供web管理界面,默认未开启,启用后可以通过web界面的方式查看、管理子进程
port=127.0.0.1:9001 #Web管理后台的IP和端口,如果开放到公网,需要注意安全性
username=user #登录管理后台的用户名
password=123 #登录管理后台的密码
[supervisord]
logfile=/tmp/supervisord.log #日志文件,默认是 $CWD/supervisord.log
logfile_maxbytes=50MB #日志文件大小,超出会rotate,默认 50MB,如果设成0,表示不限制大小
logfile_backups=10 #日志文件保留备份数量默认10,设为0表示不备份
loglevel=info #日志级别,默认info,其它: debug,warn,trace
pidfile=/tmp/supervisord.pid #pid 文件
nodaemon=false #是否在前台启动,默认是false,即以 daemon 的方式启动
minfds=1024 #可以打开的文件描述符的最小值,默认 1024
minprocs=200 #可以打开的进程数的最小值,默认 200
[supervisorctl]
serverurl=unix:///tmp/supervisor.sock #通过UNIX socket连接supervisord,路径与unix_http_server部分的file一致
serverurl=http://127.0.0.1:9001 #通过HTTP的方式连接supervisord
#包含其它配置文件
[include]
files = relative/directory/*.ini #可以指定一个或多个以.ini结束的配置文件
4.2 program配置
也就是需要监控的子进程配置,
# 子进程的名称,也即web界面中展示的进程名称
[program:blog]
#脚本目录
directory=/opt/bin
#脚本执行命令
command=/usr/bin/python /opt/bin/test.py
#supervisor启动的时候是否随着同时启动,默认True
autostart=true
#设置子进程挂掉后自动重启的情况,有三个选项,false,unexpected和true。
# false 表示无论什么情况下,都不会重新启动
# unexpected 表示只有当进程的退出码不在下面的exitcodes里面定义的时候,才进行重启
# true 表示只要异常退出就自动重启
autorestart=false
#这个选项是子进程启动多少秒之后,此时状态如果是running,则我们认为启动成功了。默认值为1
startsecs&