平滑重启_让你的 Go 服务优雅的重启 (解决代码发布 Go 服务闪断的问题)

本文探讨了Go服务在代码更新时遇到的闪断问题,原因是暴力重启导致的服务中断。提出通过发送SIGUSR2信号进行平滑重启的解决方案,推荐使用gracehttp或overseer库。实验证明,平滑重启显著减少了错误请求,同时要求supervisord版本至少为3.2.0。文中还简单解析了overseer的原理,包括Fetcher的运行机制和主进程管理。
摘要由CSDN通过智能技术生成

1527a20609b3c15cdf5de9d5458cf917.png

起因

有同学反馈 发布 Go 服务代码 监控报警会出现一堆 5xx 报警

原因

查看生产环境的项目部署脚本 发现目前的部署脚本会

 supervisorctl restart  monkey_interact_service

暴力重启 supervisor 托管的守护进程
会导致 go 的 server 先 stop 停止 web 服务,再 start 提供新的 web 服务,
导致上线过程中的请求失败 监控报警群里一吨报警

解决方案

给 Go 进程发送 SIGUSR2 信号 优雅重启 过程中不会中断 web 服务
go web 服务可以采用 gracehttp oversee 等成熟的技术方案
github.com/facebookarchive/grace
github.com/jpillora/overseer

验证 — 实践是检验代码的唯一标准

未使用优雅重启前supervisorctl restart monkey_interact_service
用 wrk 压测 开 12 个线程 每秒钟 4000 个请求 请求 20s
有 209456 个成功请求
有 163580 个错误请求

49aa766f4370b5480328468bca044752.png

使用优雅重启后supervisorctl signal SIGUSR2 monkey_interact_service
同样的 使用 wrk 压测 开 12 个线程 每秒钟 4000 个请求 请求 20s
223552 个成功请求0 个错误请求

11cb08f29cf946a21e56c33423a6271e.png

supervisord 版本要求

supervisord >= 3.2.0
由于 supervisord 3.2.0 才增加对 signal 信号的支持
详见 supervisord.org/changes.html#id20

9bdc0d28c9b21df427e51465661bed7f.png

oversee 的原理简析

  1. overseer 添加了 Fetcher,当 Fetcher 返回有效的二进位流 (io.Reader) 时,主进程会将它保存到临时位置并验证它,替换当前的二进制文件并启动。
    Fetcher 运行在一个 goroutine 中,预先会配置好检查的间隔时间。Fetcher 支持 File、GitHub、HTTP 和 S3 的方式。详细可查看包 package fetcher

  2. overseer 添加了一个主进程管理平滑重启。子进程处理连接,能够保持主进程 pid 不变。

    e551a53b54ca932d6aab7cadfa681f00.png

笔者才疏学浅,仓促成文,如有不当之处,还请大家斧正.

关注微信公众号『代码与远方』,后台回复 “1024” 查看更多内容,回复 “微信” 添加我微信。

47ec5a993b7420a98a46b99c2767ebb7.gif

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值