supervisor系列:4、子进程

supervisor系列:4、子进程


supervisord的主要目的是根据配置文件中的数据创建和管理进程。它通过创建子进程来实现这一点。supervisor生成的每个子进程在其整个生命周期内都由supervisord管理( supervisord是它创建的每个进程的父进程)。当子进程死亡时,通过 SIGCHLD信号通知supervisor其子进程死亡,并执行适当的操作。

1. 非后台运行的子进程

应该在supervisor下运行的程序不应该将自己守护化。相反,它们应该在前台运行。它们不应该与启动它们的终端分离。

判断一个程序是否将在前台运行的最简单方法是运行从shell提示符调用该程序的命令。如果它给了你对终端的控制权,但是继续运行,那么它本身就会被daemon化,这几乎肯定是在supervisor下运行的错误方式。您需要运行一个命令,该命令实际上需要按Ctrl-C以恢复对终端的控制。如果在运行它之后,不需要按Ctrl-C就返回一个shell提示,那么在supervisor下它是没有用的。所有程序都有在前台运行的选项,但没有标准的方式来做它;您需要阅读每个程序的文档。

下面是一些配置文件示例,它们可以在Supervisor下的“前台”模式下启动通用程序。

1.1 程序配置示例

下面是一些“真实世界”的程序配置示例:

1.1.1 Apache 2.2.6
[program:apache2]
command=/path/to/httpd -c "ErrorLog /dev/stdout" -DFOREGROUND
redirect_stderr=true
1.1.2 Two Zope 2.X instances and one ZEO server
[program:zeo]
command=/path/to/runzeo
priority=1

[program:zope1]
command=/path/to/instance/home/bin/runzope
priority=2
redirect_stderr=true

[program:zope2]
command=/path/to/another/instance/home/bin/runzope
priority=2
redirect_stderr=true
1.1.3 Postgres 8.X
[program:postgres]
command=/path/to/postmaster
; we use the "fast" shutdown signal SIGINT
stopsignal=INT
redirect_stderr=true
1.1.4 OpenLDAP slapd
[program:slapd]
command=/path/to/slapd -f /path/to/slapd.conf -h ldap://0.0.0.0:8888
redirect_stderr=true

1.2 其它示例

其他shell脚本的例子可以在http://thedjbway.b0llix.net/services.html上找到,这些脚本可以用来在supervisord下启动服务。这些例子实际上是针对daemontools的,但前提对于supervisor是一样的。

另一个用于在前台启动各种程序的方法集合可以从http://smarden.org/runit/runscripts.html获得。

2. pidproxy程序

有些进程(如mysqld)会忽略由supervisord生成的发送给实际进程的信号。相反,由这些类型的程序创建的“特殊”线程/进程负责处理信号。这是有问题的,因为supervised只能杀死它自己创建的进程。如果一个由supervised创建的进程创建了它自己的子进程,那么supervised就不能杀死它们。

幸运的是,这些类型的程序通常会编写一个“pidfile”,其中包含“特殊”进程的PID,并用于读取和杀死进程。作为这种情况的解决方案,一个特殊的pidproxy程序可以处理这类进程的启动。pidproxy程序是一个启动进程的小垫片,在接收到信号后,将信号发送给pidfile中提供的pid。下面提供了一个启用pidproxy程序的示例配置程序条目。

[program:mysql]
command=/path/to/pidproxy /path/to/pidfile /path/to/mysqld_safe

当supervisor被安装时,pidproxy程序被放到你的配置的$BINDIR中(它是一个“控制台脚本”)。

3. 子进程环境

子进程将继承用于启动supervisord的shell环境。在子环境中,有几个环境变量也会被supervisord自己设置,包括SUPERVISOR_ENABLED(一个指示进程处于supervisor控制下的标志),SUPERVISOR_PROCESS_NAME(这个进程的配置文件指定的进程名)和SUPERVISOR_GROUP_NAME(子进程的配置文件指定的进程组名)。

这些环境变量可以在名为environment(适用于所有子进程)的[supervisor]节配置选项中覆盖,或者在per- [program:x]environment配置选项中覆盖(仅适用于[program:x]节指定的子进程)。这些“环境”设置是附加的。换句话说,每个子进程的环境将包括:

在shell中设置的环境变量用于启动supervisor…

… 添加到/覆盖 …

… 在“environment”全局配置选项中设置的环境变量 …

… 添加到/覆盖 …

​… supervisor-specific环境变量(SUPERVISOR_PROCESS_NAME SUPERVISOR_ENABLED SUPERVISOR_GROUP_NAME) …

​… 添加到/覆盖 …

​… 在每个进程中设置的环境变量“环境”配置选项。

在运行子进程时,没有shell被supervisord执行,所以像USERPATHHOMESHELLLOGNAME等环境变量不会从默认值改变或重新分配。注意,当您以root用户运行配置中带有user=节的supervisord程序时,这一点特别重要。与cron不同,当对user=程序配置选项中定义的用户执行setuid时,supervisord不会试图识别和覆盖基本环境变量,如USERPATHHOMELOGNAME。如果需要为特定程序设置环境变量,而这些变量可能由shell调用为特定用户设置,则必须在environment= 程序配置选项中显式设置。下面是设置这些环境变量的示例。

[program:apache2]
command=/home/chrism/bin/httpd -c "ErrorLog /dev/stdout" -DFOREGROUND
user=chrism
environment=HOME="/home/chrism",USER="chrism"

4. 进程状态

一个由supervisord控制的过程在任何时候都将处于以下状态之一。您可以在客户机的各种用户界面元素中看到这些状态名。

STOPPED (0)

由于停止请求,进程已经停止或从未启动。

STARTING (10)

由于启动请求,进程正在启动。

RUNNING (20)

进程正在运行。

BACKOFF (30)

进程进入STARTING状态,但随后退出的速度太快(在startsecs中定义的时间之前),无法移动到RUNNING状态。

STOPPING (40)

由于停止请求,进程正在停止。

EXITED (100)

进程从RUNNING状态退出(预期或意外)。

FATAL (200)

进程无法成功启动。

UNKNOWN (1000)

进程处于未知状态(supervisord程序错误)。

每一个在supervisor下运行的进程都按照下面的有向图通过这些状态进行。

Subprocess State Transition Graph

子进程状态转换图

如果进程已从管理上停止或从未启动过,则该进程处于STOPPED状态。

当一个自动重启的进程处于BACKOFF状态时,它将被supervisord自动重启。它将在STARTINGBACKOFF状态之间切换,直到明显地发现它无法启动,因为startretries的数量已经超过了最大数量,这时它将过渡到FATAL状态。

注意:

根据后续尝试次数的不同,重试将花费越来越多的时间,每次增加一秒。

因此,如果您设置startretries=3,supervisord将在每次重启尝试之间等待1秒、2秒、3秒,总共等待5秒。

当一个进程处于EXITED状态时,它会自动重启:

  • 如果它的autorestart参数设置为false,则永远不会。
  • 如果它的autorestart参数设置为true,则无条件。
  • 如果其autorestart参数设置为unexpected,则有条件地设置。如果它退出时的退出码与进程的exitcodes配置参数中定义的退出码不匹配,它将被重新启动。

如果将流程配置为有条件或无条件地自动重启,流程将自动从EXITED过渡到RUNNINGRUNNINGEXITED之间的转换数量没有任何限制:可以创建一个不断重启退出进程的配置。这是一个特性,而不是一个bug。

如果最终处于FATAL状态(必须从这种状态手动重新启动),则自动重新启动的进程将永远不会被自动重新启动。

进程通过一个管理停止请求转换到STOPPING状态,然后将以STOPPED状态结束。

无法成功停止的进程将永远处于STOPPING状态。在正常操作期间不应该出现这种情况,因为这意味着进程没有响应上级发送给它的最终SIGKILL信号,这在UNIX下是“不可能的”。

状态转换总是需要用户操作来调用:

FATAL` -> `STARTING
RUNNING` -> `STOPPING

状态转换通常(但不总是)需要用户操作来调用,例外情况请注意:

STOPPED -> STARTING (如果进程被配置为自动启动,则在supervisord启动时除外)

EXITED -> STARTING (除非进程被配置为自动重启)

所有其他状态转换都由supervise自动管理。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值