apscheduler job中断场景

背景:

flask项目,gunicorn server,apscheduler定时框架

Server配置:1个worker,timeout设置为900s(15min),单点

apscheduler定时任务配置:max thread 20, max process 5,misfire_grace_time 900,当前job几百个

 

问题:

运行时遇到有些job莫名其妙中断,job本身code没有问题 

 

日志:

日志1:

2019-08-08 09:22:18,410 base.py:120:WARNING:Run time of job "Monitor Job (trigger: interval[1 day, 0:00:00], next run at: 2019-08-08 09:07:07 GMT)" was missed by 0:15:10.588683

日志2:

2019-08-08 09:06:56,435 __init__.py:184:INFO:Job update sql:insert xx into xxx
[2019-08-08 09:21:56 +0000] [9765] [CRITICAL] WORKER TIMEOUT (pid:10176)
[2019-08-08 09:21:57 +0000] [10440] [INFO] Booting worker with pid: 10440
2019-08-08 09:21:57,935 base.py:433:INFO:Adding job tentatively -- it will be properly scheduled when the scheduler starts
2019-08-08 09:21:58,055 base.py:867:INFO:Added job "manage_backend_jobs" to job store "default"
2019-08-08 09:21:58,055 base.py:159:INFO:Scheduler started

 

分析:

日志1原因:根据配置观察,可能因为当前线程池线程数量达到上限,该job持续等待,超过了900s仍未执行,job中断

日志2原因:查看日志时间有个较大幅度的变化,正好符合配置中的15min超时设置,可以认为该job在运行阶段因网络IO或其他原因阻塞,导致worker达到超时上限,scheduler重启

 

解决:

(1)查询服务器当前性能,适当提高进程池,线程池配置

(2)分布式Job 

 

参考:

https://github.com/benoitc/gunicorn/issues/1801

 

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Jalen备忘录

谢谢~~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值