python 调度系统_[转]Python 任务调度利器:APScheduler

任务调度应用场景

离线作业调度:按时间粒度执行某项任务

共享缓存更新:定时刷新缓存,如redis缓存;不同进程间的共享数据

linux的crontab, 支持按照分钟/小时/天/月/周粒度,执行任务

java的Quartz

windows的任务计划

APScheduler

组件介绍

任务job:任务id和任务执行func

触发器triggers:确定任务何时开始执行

任务存储器job stores: 保存任务的状态

执行器executors:确定任务怎么执行

任务事件event:监控任务执行异常情况

调度器schedulers:串联任务的整个生命周期,添加编辑 任务 到 任务存储器 ,在任务的执行时间到来时,把任务交给执行器执行返回结果;同时发出事件监听,监控任务事件 。

安装

pip install apscheduler

简单例子

from apscheduler.schedulers.background import BackgroundScheduler

from apscheduler.executors.pool import ThreadPoolExecutor, ProcessPoolExecutor

from apscheduler.jobstores.sqlalchemy import SQLAlchemyJobStore

from apscheduler.events import EVENT_JOB_EXECUTED, EVENT_JOB_ERROR

import logging

import datetime

# 任务执行函数

def job_func(job_id):

print('job %s is runed at %s' % (job_id, datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')))

# 事件监听

def job_exception_listener(event):

if event.exception:

# todo:异常处理, 告警等

print('The job crashed :(')

else:

print('The job worked :)')

# 日志

logging.basicConfig()

logging.getLogger('apscheduler').setLevel(logging.DEBUG)

# 定义一个后台任务非阻塞调度器

scheduler = BackgroundScheduler()

# 添加一个任务到内存中

# 触发器:trigger='interval' seconds=10 每10s触发执行一次

# 执行器:executor='default' 线程执行

# 任务存储器:jobstore='default' 默认内存存储

# 最大并发数:max_instances

scheduler.add_job(job_func, trigger='interval', args=[1], id='1', name='a test job', max_instances=10, jobstore='default', executor='default', seconds=10)

# 设置任务监听

scheduler.add_listener(job_exception_listener, EVENT_JOB_EXECUTED | EVENT_JOB_ERROR)

# 启动调度器

scheduler.start()

运行情况

job 1 is runed at 2020-03-21 20:00:38

The job worked :)

job 1 is runed at 2020-03-21 20:00:48

The job worked :)

job 1 is runed at 2020-03-21 20:00:58

The job worked :)

触发器

sched.add_job(job_function, 'interval', hours=2, start_date='2010-10-10 09:30:00', end_date='2014-06-15 11:00:00')

sched.add_job(my_job, 'date', run_date=datetime(2009, 11, 6, 16, 30, 5), args=['text'])

year (int|str) – 4-digit year

month (int|str) – month (1-12)

day (int|str) – day of the (1-31)

week (int|str) – ISO week (1-53)

day_of_week (int|str) – number or name of weekday (0-6 or mon,tue,wed,thu,fri,sat,sun)

hour (int|str) – hour (0-23)

minute (int|str) – minute (0-59)

second (int|str) – second (0-59)

start_date (datetime|str) – earliest possible date/time to trigger on (inclusive)

end_date (datetime|str) – latest possible date/time to trigger on (inclusive)

# 星期一到星期五,5点30执行任务job_function,直到2014-05-30 00:00:00

sched.add_job(job_function, 'cron', day_of_week='mon-fri', hour=5, minute=30, end_date='2014-05-30')

# 按照crontab格式执行, 格式为:分钟 小时 天 月 周,*表示所有

# 5月到8月的1号到15号,0点0分执行任务job_function

sched.add_job(job_function, CronTrigger.from_crontab('0 0 1-15 may-aug *'))

执行器

apscheduler.executors.asyncio:同步io,阻塞

apscheduler.executors.gevent:io多路复用,非阻塞

apscheduler.executors.pool: 线程ThreadPoolExecutor和进程ProcessPoolExecutor

apscheduler.executors.twisted:基于事件驱动

任务存储器

apscheduler.jobstores.memory:内存

apscheduler.jobstores.mongodb:存储在mongodb

apscheduler.jobstores.redis:存储在redis

apscheduler.jobstores.rethinkdb:存储在rethinkdb

apscheduler.jobstores.sqlalchemy:支持sqlalchemy的数据库如mysql,sqlite等

apscheduler.jobstores.zookeeper:zookeeper

调度器

BlockingScheduler:适用于调度程序是进程中唯一运行的进程,调用start函数会阻塞当前线程,不能立即返回。

BackgroundScheduler:适用于调度程序在应用程序的后台运行,调用start后主线程不会阻塞。

AsyncIOScheduler:适用于使用了asyncio模块的应用程序。

GeventScheduler:适用于使用gevent模块的应用程序。

TwistedScheduler:适用于构建Twisted的应用程序。

QtScheduler:适用于构建Qt的应用程序。

scheduler.add_job(job_func, trigger='interval', args=[1], id='1', name='a test job', max_instances=10, jobstore='default', executor='default', seconds=10)

from pytz import utc

from apscheduler.schedulers.background import BackgroundScheduler

from apscheduler.jobstores.mongodb import MongoDBJobStore

from apscheduler.jobstores.sqlalchemy import SQLAlchemyJobStore

from apscheduler.executors.pool import ThreadPoolExecutor, ProcessPoolExecutor

# 通过dict方式执行不同的jobstores、executors和默认的参数

jobstores = {

'mongo': MongoDBJobStore(),

'default': SQLAlchemyJobStore(url='sqlite:///jobs.sqlite')

}

executors = {

'default': ThreadPoolExecutor(20),

'processpool': ProcessPoolExecutor(5)

}

job_defaults = {

'coalesce': False,

'max_instances': 3

}

# 定义调度器

scheduler = BackgroundScheduler(jobstores=jobstores, executors=executors, job_defaults=job_defaults, timezone=utc)

def job_func(job_id):

print('job %s is runed at %s' % (job_id, datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')))

# 添加任务

scheduler.add_job(job_func, trigger='interval', args=[1], id='1', name='a test job', jobstore='default', executor='processpool', seconds=10)

# 启动调度器

scheduler.start()

# add_job

scheduler.add_job(job_func, trigger='interval', args=[1], id='1', name='a test job', max_instances=10, jobstore='default', executor='default', seconds=10)

# remove_job: 通过任务唯一的id,删除的时候对应的任务存储器里记录也会删除

scheduler.add_job(myfunc, 'interval', minutes=2, id='my_job_id')

scheduler.remove_job('my_job_id')

# Pausing and resuming jobs:暂停和重启任务

scheduler.add_job(myfunc, 'interval', minutes=2, id='my_job_id')

scheduler.pause_job('my_job_id')

scheduler.resume_job('my_job_id')

# Modifying jobs:修改任务的配置

job = scheduler.add_job(myfunc, 'interval', minutes=2, id='my_job_id', max_instances=10)

# 修改任务的属性

job.modify(max_instances=6, name='Alternate name')

# 修改任务的触发器

scheduler.reschedule_job('my_job_id', trigger='cron', minute='*/5')

EVENT_JOB_ERROR: 表示任务在执行过程的出现异常触发

EVENT_JOB_EXECUTED:任务执行成功时

EVENT_JOB_MAX_INSTANCES:调度器上执行的任务超过配置的参数时

scheduler.add_listener(job_exception_listener, EVENT_JOB_EXECUTED | EVENT_JOB_ERROR)

参考

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值