supervisor-eventlistener

了解supervisor-eventlistener

本文主要介绍 supervisor Event 的功能。

supervisor 作为一个进程管理工具,在 3.0 版本之后,新增了 Event 的高级特性, 主要用于做(进程启动、退出、失败等)事件告警服务。
Event 特性是将监听的服务(listener)注册到supervisord中,当supervisord监听到相应事件时,将事件信息推送给监听对应事件的listener。

事件类型

Event 可以设置 27 种事件类型,可以分为如下几类:

1. 监控进程状态转移事件;
2. 监控进程状态日志变更事件;
3. 进程组中进程添加删除事件;
4. supervisord 进程本身日志变更事件;
5. supervisord 进程本身状态变更的事件;
6. 定时触发事件。

事件可以被单独监听,也可以一个listener 监听多种事件。

配置说明

对于一个listener,与正常program的区别是,新增了events 参数,用于标识要监听的事件。

[eventlistener:theeventlistenername]
events=PROCESS_STATE,TICK_60 
buffer_size=10 ; 事件池子大小(输入流大小)

事件类型配置多个,用逗号分割。上述配置的是子进程状态的变更,以及定时60s通知间隔60s
事件通知缓冲区大小,可以自定义配置,上述配置了10个事件消息的缓冲。

Listener 的实现

与supervisord 的交互
由于supervisord 是 listener的父进程,所以交互方式采用最简单的 标准输入输出的方式交互。listener 通过标准输入获取事件,通过标准输出通知supervisord listener的事件处理结果,以及当前supervisord的状态

listener 的状态

listener 有三种状态:ACKNOWLEDGED、READY、BUSY.

  • ACKNOWLEDGED: listener 未就绪的状态。(发送READY之前的状态)
  • READY: 等待事件触发的状态。(发送READY 消息后,未收到消息的状态)
  • BUSY: 事件处理中的状态。(即输出 OK, FAIL 之前处理Event消息时的状态)
    supervisor_listener_status.jpg

消息协议

消息包括supervisord 通知给listener 的事件消息和 listener 通知给supervisord 的状态变更消息。

listener 的状态变更消息, READY

状态OK的 “READYn” 消息
处理成功 “RESULT 2nOK” 消息
处理失败 “RESULT 4nFAIL” 消息
supervisord 广播的事件消息, 事件消息分为 header 和 payload 两部分。 header 中采用kv的方式发送,header 中包含了 payload 的长度。

例如官网提供的header 的例子:

ver:3.0 server:supervisor serial:21 pool:listener poolserial:10 eventname:PROCESS_COMMUNICATION_STDOUT len:54

header 含义:

  • serial 为事件的序列号
  • pool 表示listener 的进程池名称(listener支持启动多个)
  • poolserial 表示listener的进程池序列号
  • eventname 事件名称
  • len body 的长度
  • Listener 的基本流程
  • listener 的处理流程如下:
  1. 发送ready消息,等待事件发生。
  2. 收到事件后,处理事件
  3. 事件处理完成后,发送 result 消息, 从第一步开始循环
    进程状态转移举例
    我们以进程状态转移作为例子,做简单介绍。

首先,使用 golang 实现listener
版本1

package main

import (
    "bufio"
    "os"
    "strconv"
    "strings"
)

const RESP_OK = "RESULT 2\nOK"
const RESP_FAIL = "RESULT 4\nFAIL"

func main() {
    stdin := bufio.NewReader(os.Stdin)
    stdout := bufio.NewWriter(os.Stdout)
    stderr := bufio.NewWriter(os.Stderr)

    for {    
        // 发送后等待接收event
        _, _ = stdout.WriteString("READY\n")
        _ = stdout.Flush()
        // 接收header
        line, _, _ := stdin.ReadLine()          
        stderr.WriteString("read" + string(line))
        stderr.Flush()

        header, payloadSize := praseHeader(line)

        // 接收payload
        payload := make([]byte, payloadSize)
        stdin.Read(payload)   
        stderr.WriteString("read : " + string(payload))
        stderr.Flush()

        result := alarm(header, payload)

        if result {   // 发送处理结果
            stdout.WriteString(RESP_OK)
        } else {
            stdout.WriteString(RESP_FAIL)
        }
        stdout.Flush()
    }
}

func praseHeader(data []byte) (header map[string]string, 
        payloadSize int) {
    pairs := strings.Split(string(data), " ")
    header = make(map[string]string, len(pairs))

    for _, pair := range pairs {
        token := strings.Split(pair, ":")
        header[token[0]] = token[1]
    }

    payloadSize, _ = strconv.Atoi(header["len"])
    return header, payloadSize
}

// 这里设置报警即可
func alarm(header map[string]string, payload []byte) bool {
    // send mail
    return true
}

版本2

package main

import (
	"bufio"
	"fmt"
	"github.com/urfave/cli/v2"
	"os"
	"runtime/debug"
	"strings"
	"time"
)

const (
	RespOk = "RESULT 2\nOK"

	logPath = "./supervisor-event.log"
)

const RESP_FAIL = "RESULT 4FAIL"

func main() {
	//b := []byte("processname:config_back_8001 groupname:config_back_8001 from_state:STOPPED tries:0ver:3.0 server:supervisor serial:1897 pool:mylistenter poolserial:15 eventname:PROCESS_STATE_RUNNING len:85----------")
	//parseInfo(b)
	//os.Exit(3)
	// 默认并发数
	app := &cli.App{
		Name:  "services-notice",
		Usage: "services-notice on supervisor",
		Flags: []cli.Flag{
			&cli.StringFlag{
				Name:     "log_path",
				Aliases:  []string{"l"},
				Usage:    "`log_path` to write log default " + logPath,
				Required: false,
			},
		},
		Action: func(c *cli.Context) error {
			path := logPath
			return RevMsg(path)
		},
	}
	_ = app.Run(os.Args)
}

// RevMsg 处理消息
func RevMsg(logPath string) (err error) {
	var (
		f  *os.File
		ti = time.Now().Format("2006-01-02 15:04:05 --->")
	)

	stdin := bufio.NewReader(os.Stdin)
	stdout := bufio.NewWriter(os.Stdout)

	if f, err = os.Create(logPath); nil != err {
		return
	}

	defer func() {
		if er := recover(); er != nil {
			_, _ = f.Write(debug.Stack())
		}
	}()

	for {
		var line []byte

		// 发送后等待接收event
		_, err = stdout.WriteString("READY\n")
		if err != nil {
			_, _ = f.Write([]byte(ti + "stdout.WriteString(\"READY\\n\")" + err.Error()))
			goto END
		}
		_ = stdout.Flush()

		//接受数据
		if line, _, err = stdin.ReadLine(); err != nil {
			_, _ = f.Write([]byte(ti + "stdin.ReadLine()\n" + err.Error()))
			goto END
		}

		if strings.Contains(string(line), "TICK") {
			//write log
			_, err = f.Write([]byte(ti))
			if len(line) > 15 {
				line = line[len(line)-13:]
			}
			if _, err = f.Write(append(line, '\n')); err != nil {
				_, _ = f.Write([]byte(ti + "f.Write(line)\n" + err.Error()))
				goto END

			}
			goto END

		}
		//write log
		_, err = f.Write([]byte(time.Now().Format("2006-01-02 15:04:05 --->")))
		if _, err = f.Write(append(line, '\n')); err != nil {
			_, _ = f.Write([]byte(ti + "f.Write(line)\n" + err.Error() + "\n"))
			goto END

		}

		//tidy info
		if err = parseInfo(line); nil != err {
			_, _ = f.Write([]byte(ti + "parseInfo(line) " + err.Error() + "\n"))
			goto END
		}

	END:
		if _, err = stdout.WriteString(RespOk); nil != err {
			_, _ = f.Write([]byte(ti + "stdout.WriteString(RESP_OK)" + err.Error()))
			_, _ = stdout.WriteString(RespOk)

		}
		_ = stdout.Flush()

	}
}

// 解析消息
func parseInfo(data []byte) (err error) {
	var (
		d       []string
		mapInfo = map[string]string{}
	)
	d = strings.Split(string(data), " ")
	for _, v := range d {
		dp := strings.Split(v, ":")
		if len(dp) < 2 {
			continue
		}
		mapInfo[dp[0]] = dp[1]
	}
	if _, ok := mapInfo["eventname"]; !ok {
		return
	}
	return alarm(mapInfo)
}

// 报警
func alarm(mapInfo map[string]string) (err error) {
	var (
		token string
		b     = fmt.Sprintf(`
	//;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
	//;事件-%s
	//;服务-%s
	//;事件-%s
	//;状态-%s
	//;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
	//`, time.Now().Format("2006-0-02 15:04:05"), mapInfo["processname"], mapInfo["eventname"], mapInfo["from_state"])
	)
	//获取token
	if token, err = getAccessToken(); nil != err {
		return
	}

	//发送消息
	return pushMsg(token, b)
}

// 获取token
func getAccessToken() (accessToken string, err error) {
	return
}

// push msg
func pushMsg(token, msg string) (err error) {

	return
}

这里,报警处理未填写。

其次,在supervisor 中添加配置,监听服务:

[program:sleep]
process_name=%(program_name)s
command=/usr/bin/sleep 100
events=EVENT
autostart=true
autorestart=true

[program:sleep2]
process_name=sleep2-2
command=/usr/bin/sleep 1000
events=EVENT
autostart=true
autorestart=true

配置测试服务 用于测试

[eventlistener:listener]
command=/root/listener ;要执行的脚本
process_name=test
events=PROCESS_STATE,TICK_5 ;坚挺的事件类型
stdout_logfile=/var/log/tmp/listener_test_stdout.log 
stderr_logfile=/var/log/tmp/listener_test_stderr.log
user=root

这里监听了服务的处理状态,以及每5s的心跳消息。
[eventlistener:listener]的listenter 这个名字随便写,是监听子进程的名字
process_name=test 可写 可不写

最后,启动listener。

supervisorct start listener

从stderr的日志中可以看到,简单的TICK_5 的消息(调整了格式):

header : ver:3.0 server:supervisor serial:256 pool:listener_test poolserial:173 eventname:TICK_5 len:15read 
payload: when:1586258030
fastcgi 进程状态变更的消息:

header : ver:3.0 server:supervisor serial:291 pool:listener_test poolserial:208 eventname:PROCESS_STATE_EXITED len:87
payload: processname:fastcgi_test groupname:fastcgi_test from_state:RUNNING expected:0 pid:19119

header :ver:3.0 server:supervisor serial:293 pool:listener_test poolserial:210 eventname:PROCESS_STATE_STARTING len:73
payload: processname:fastcgi_test groupname:fastcgi_test from_state:EXITED tries:0

参考文章

https://segmentfault.com/a/1190000022298049/

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

a...Z

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值