Celery任务队列详解-CSDN博客

celery简介

celery 是一个基于分布消息传递的异步任务队列，他可以让任务的执行脱离主程序，也可以分配到其他得主机上运行。我们可以用它实现异步任务和定时任务。
复制代码

使用场景

1.你想对100台机器执行一条批量命令，可能会花很长时间 ，但你不想让你的程序等着结果返回，而是给你返回 一个任务ID,
你过一段时间只需要拿着这个任务id就可以拿到任务执行结果， 在任务执行进行时，你可以继续做其它的事情。
2.你想做一个定时任务，比如每天检测一下你们所有客户的资料，如果发现今天 是客户的生日，就给他发个短信祝福
复制代码

celery模块

任务模块 Task

包含异步任务和定时任务，异步任务通常在业务逻辑中被触发并分发往任务队列，定时任务是由celery beat 进程周期性地姜任务发往任务队列
复制代码

消息中间件 Broker

celery使用消息进行通信，broker也就是消息传递机制， 接手任务生产者发来的任务， 将任务存入队列中。

附：可使用的broker，官方目前推荐的稳定性较高的主要是RabbitMQ和Redis：
复制代码

任务执行单元 Worker

worker是任务执行单元，他实时监控消息队列，获取队列中调度的任务并执行
复制代码

任务结果存储 Backend

Backend 用于存储任务的执行结果，以供查询。同消息中间件一样，存储也可使用 RabbitMQ, Redis 和 MongoDB 等
复制代码

celery 基本工作流程简述

celery的简单使用

创建一个celery的异步任务可以简单的分为三步：（这里使用redis作为broker）

1、创建celery实例

2、启动worker

3、调用celery异步任务
复制代码

创建 celery 实例

首先安装celery

pip install celery
复制代码

创建 celery应用 tasks.py,在这里broker使用的是redis，关于redis的使用就不在这里说明了

# -*- coding: utf-8 -*-

import time

from celery import Celery


# celery实例，在这里我的broker和backend都是设置的redis
app = Celery('tasks', backend='redis://:@127.0.0.1:6379/2', broker='redis://:@127.0.0.1:6379/2')

@app.task
def add(x, y):
    return x + y


@app.task
def sleep_task(timeout=20):
    for i in range(timeout):
        print i
        time.sleep(1)
    return timeout
复制代码

启动worker，这里的worker启动的就是之前写的tasks.py文件

celery -A tasks worker --loglevel=info
复制代码

进入Python环境

delay()是celery的任务调用方式，其中delay 是使用 apply_async 的快捷方式。apply_async 支持更多的参数，它的一般形式如下

ready()可以获取任务的完成状态 get()可以获取任务的结果 get(propagate=True),可以在任务异常时覆盖这一行为 result.traceback，可以获取异常

celery 工作流

首先看一下 signature() 与 chain()

首先引入两个包
from tasks import add
from celery import signature, chain
复制代码

利用signature创建一个任务，可以看到这个任务也支持delay(),也可以直接调用

Simple chain

chain可以将 signature任务链接在一起，形成一条任务链，将多个任务串联在一起相继调用，同时可以使下一个任务使用上一个任务的返回值。注：s是signature的简写

Immutable signatures

不可变签名,可以看到每个签名任务都与上一个任务没有关系，都是独立的任务，也可以用chain链接在一起

add.signature((2, 2), immutable=True)
# 可以简写为
add.si(2, 2)
res = chain(add.si(2, 2) | add.si(4, 4) | add.si(8, 8))()
复制代码

django 中使用celery

想要在django中使用celery，首先需要配置一个celery的应用，官方建议的是在settings文件的同目录下创建一个celery.py的实例

# 绝对导入，防止与celery冲突
from __future__ import absolute_import, unicode_literals
import os
from celery import Celery

# 设置Django的环境变量
os.environ.setdefault('DJANGO_SETTINGS_MODULE', 'proj.settings')
# celery app
app = Celery('proj')

# Using a string here means the worker doesn't have to serialize
# the configuration object to child processes.
# - namespace='CELERY' means all celery-related configuration keys
#   should have a `CELERY_` prefix.
# 配置前缀
app.config_from_object('django.conf:settings', namespace='CELERY')

# Load task modules from all registered Django app configs.
# 自动扫描app下的tasks文件
app.autodiscover_tasks()


@app.task(bind=True)
def debug_task(self):
    print('Request: {0!r}'.format(self.request))
复制代码

然后需要在init文件下引入这个模块,确保django启动时加载文件

from __future__ import absolute_import, unicode_literals

# This will make sure the app is always imported when
# Django starts so that shared_task will use this app.
from .celery import app as celery_app

__all__ = ['celery_app']
复制代码

接下来是在settings的配置参数

# Celery settings
from __future__ import absolute_import, unicode_literals

# broker
CELERY_BROKER_URL = 'redis://:@127.0.0.1:6379/3'
# 内容类型，默认所有类型
CELERY_ACCEPT_CONTENT = ['application/json']
# 任务结果
CELERY_RESULT_BACKEND = 'django-db'
CELERY_TASK_SERIALIZER = 'json'
CELERY_RESULT_SERIALIZER = 'json'
CELERY_TIMEZONE = 'Asia/Shanghai'
# 更多配置可以查看
# http://docs.celeryproject.org/en/latest/userguide/configuration.html#std:setting-accept_content

# 定时任务配置
CELERY_BEAT_SCHEDULE = {

}
复制代码

如果 CELERY_RESULT_BACKEND 设置了django，注意需要INSTALLED_APPS配置下

配置下数据库，在数据库中就可以查看任务的执行情况了
python manage.py migrate django_celery_results
复制代码

INSTALLED_APPS = (
    ...,
    'django_celery_results',
)
复制代码

任务继承

继承Task，可以更好的控制任务，在这里重写了Task的几个方法

# -*- coding: utf-8 -*-
# ___author__ = 'gwx'

import celery


class BaseTask(celery.Task):
    """
        celery 基类, 继承Task
    """

    def __call__(self, *args, **kwargs):
        """

        :param args:
        :param kwargs:
        :return:
        """
        print('TASK STARTING: {0.name}[{0.request.id}]'.format(self))
        return super(BaseTask, self).__call__(*args, **kwargs)

    # 任务成功
    def on_success(self, retval, task_id, args, kwargs):
        print(self.request)
        print("success")
        print(retval)
        print(task_id)
        print(args)
        print(kwargs)

        return super(BaseTask, self).on_success(retval, task_id, args, kwargs)

    # 任务失败
    def on_failure(self, exc, task_id, args, kwargs, einfo):
        print("failure")
        print(exc)
        print(task_id)
        print(args)
        print(kwargs)
        print(einfo)
        # 失败重试
        self.retry(exc=exc)

    # finally
    def after_return(self, status, retval, task_id, args, kwargs, einfo):
        print(status, retval, task_id, args, kwargs, einfo)
        print('task %s is finished' % self.name)

复制代码

创建celery任务，这里创建了几种不同类型的任务

# -*- coding: utf-8 -*-
# ___author__ = 'gwx'

import celery
from workflows.base import BaseTask


@celery.task
def add(x, y):
    return x + y


@celery.task(bind=True, base=BaseTask, name='add_success')
def add_success(self, x, y):
    """
        success 演示
    """
    s = x + y
    print("success: this result is %s" % s)
    return 'add success return'


@celery.task(bind=True, base=BaseTask, name='add_failure')
def add_failure(self, msg='this is a error task', max_retry=2):
    """
        failure 演示
    """
    print("task retries %s" % self.request.retries)
    if self.request.retries >= int(max_retry):
        return 'add failure return'
    raise Exception("add_failure message: %s" % msg)


@celery.task(bind=True, base=BaseTask, name='end_task')
def end_task(self):
    """
        最后的任务
    """
    print('this is end task')
    return 'end task'


@celery.task(bind=True, base=BaseTask, name="work_flow_task")
def work_flow_task(self):
    """
        任务流, 使用chain将 si类型 任务串接起来，这样可以模板完成对主任务的拆分，
        而自定义基类，可以更好的控制子任务
    :param self:
    :return:
    """
    success_si = add_success.si(2, 4)
    failure_si = add_failure.si(msg='retry task', max_retry=0)
    end_si = end_task.si()
    celery.chain(success_si, failure_si, end_si)()
复制代码

启动worker，进入项目的根目录

# -l celery日志等级， -c worker数，
# 大家可以通过 celery -A proj.celery worker -- help查找更多适合项目的配置
celery -A proj.celery worker -l info -c 10
复制代码

调用任务，我这里是使用django的shell调用的进入项目的根目录

python manage.py shell
# 引入了tasks
from workflows.tasks import *
# 调用add_success的celery任务
add_success.apply_async((2, 4), pri=0)
复制代码

worker执行结果

add_failure任务大家可以尝试自己执行下，不同的是增加了一个重试的功能。

链式任务

多个子任务的输出结果

定时任务

celery支持定时任务, 在setting中配置

"""
add 是此任务的lable name
task 是要执行的定时任务，必须是celery修饰的
schedule 是定时设置，一下是3s一次
当引入时，也可以这样设置：
'schedule': timedelta(seconds=5)
同时也支持crontab()
'schedule': crontab(hour=7, minute=30, day_of_week=1)
更多可查看
http://docs.celeryproject.org/en/latest/userguide/periodic-tasks.html
"""
from datetime import timedelta

# 定时任务配置
CELERY_BEAT_SCHEDULE = {
    'add': {
        'task': 'demoapp.tasks.add',
        'schedule': 3,
        'args': (2, 3)
    }
}
复制代码

定时启动和worker类似

celery beat -A proj.celery -l info
复制代码

在worker中查看结果，可以看到没隔三秒钟都会执行一边add task

当任务更新时，需要重新启动worker或者定时worker，定时相当于worker中的一个进程