当当Elastic-Job —— 利用zk轻松开启分布式定时任务

Elastic-Job

Elastic-Job有什么用

Elastic-job解决以下问题,我们开发定时任务一般都是使用quartz或者spring-task,无论是使用quartz还是spring-task,我们都会至少遇到两个痛点:

  • 不敢轻易跟着应用服务多节点部署,可能会重复多次执行而引发系统逻辑的错误。
  • quartz的集群仅仅只是用来HA,节点数量的增加并不能给我们的每次执行效率带来提升,即不能实现水平扩展。

简单来说也就是在当下分布式、集群盛行的背景下解决多台机器重复执行定时任务或需求修改配置指定单独固定的定时任务执行机器的烦恼,同时避免如果特定的某台定时任务执行机器宕机导致定时任务无法执行的尴尬场面。

废话不多说我想大家在其他地方都能看到这些介绍,我们直接上干货!

一、Mavne依赖

<dependency>
	<groupId>com.dangdang</groupId>
	<artifactId>elastic-job-lite-core</artifactId>
	<version>2.1.3</version>
</dependency>
<dependency>
	<groupId>com.dangdang</groupId>
	<artifactId>elastic-job-lite-spring</artifactId>
	<version>2.1.3</version>
</dependency>

二、创建定时作业业务类

package com.zhibo.elastic.job;

import com.dangdang.ddframe.job.api.ShardingContext;
import com.dangdang.ddframe.job.api.simple.SimpleJob;
import lombok.extern.slf4j.Slf4j;
import org.springframework.stereotype.Component;

/**
 * @author zhibo.lv
 * @title: TestJob
 * @description: Test定时任务
 * @date 2019/12/2 14:15
 */
@Slf4j
@Component
public class TestJob implements SimpleJob {
    @Override
    public void execute(ShardingContext shardingContext) {
        log.info("[elastic job TestJob] begin----------------");
        //如有设置分片获取当前任务的分片编号
        int shardingItem = shardingContext.getShardingItem();
        System.out.println("Job 分片处理:" + shardingItem);
        //自行添加业务代码 ----
        log.info("[elastic job TestJob] end----------------");
    }
}

三、配置elasticJob.xml

digest=" z o o k e e p e r . u s e r n a m e : {zookeeper.username}: zookeeper.username:{zookeeper.password}" 这个配置一般用不上 下文会有介绍

<?xml version="1.0" encoding="UTF-8"?>
<beans xmlns="http://www.springframework.org/schema/beans"
       xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
       xmlns:reg="http://www.dangdang.com/schema/ddframe/reg"
       xmlns:job="http://www.dangdang.com/schema/ddframe/job"
       xsi:schemaLocation="http://www.springframework.org/schema/beans
                        http://www.springframework.org/schema/beans/spring-beans.xsd
                        http://www.dangdang.com/schema/ddframe/reg
                        http://www.dangdang.com/schema/ddframe/reg/reg.xsd
                        http://www.dangdang.com/schema/ddframe/job
                        http://www.dangdang.com/schema/ddframe/job/job.xsd">

     <reg:zookeeper id="regCenter" server-lists="${job.registry.address}" namespace="zhibo-elastic-job"
                    base-sleep-time-milliseconds="10000" max-retries="3" max-sleep-time-milliseconds="30000"
                    digest="${zookeeper.username}:${zookeeper.password}"/>

     <job:simple id="activeAdminInfoJob" class="com.zhibo.elastic.job.TestJob"
                 registry-center-ref="regCenter"
                 sharding-total-count="1"
                 cron="0 * * * * ? "
                 sharding-item-parameters="0=0"
                 monitor-execution="false"
                 monitor-port="9888"
                 failover="true"
                 description="Test Job"
                 disabled="false"
                 overwrite="true"/>
</beans>

别忘了在applicationContext.xml里面引入elasticJob.xml

reg:zookeeper 命名空间属性详细说明

属性名类型是否必填缺省值描述
idString注册中心在Spring容器中的Id
server-listsStringZookeeper服务器地址及端口
多个地址用英文逗号隔开
namespaceStringZookeeper的命名空间
建议每个项目定义一个唯一的名字用于区分
base-sleep-time-millisecondsint1000等待重试的间隔时间的初始值(毫秒)
max-sleep-time-millisecondsint3000等待重试的间隔时间的最大值(毫秒)
max-retriesint3最大重试次数
session-timeout-millisecondsint60000会话超时时间(毫秒)
connection-timeout-millisecondsint15000连接超时时间(毫秒)
digestString直连不鉴权连接Zookeeper的权限令牌

job:simple 命名空间属性详细说明

属性名类型是否必填缺省值描述
idString作业名称
同一个命名空间下保持唯一
registry-center-refString注册中心Bean的引用
与reg:zookeeper 的id属性的值一致即可
cronStringcron表达式,用于配置作业触发时间
随便找个了表达式的学习地址
sharding-total-countint作业分片总数
不需要分片就写1
classString作业实现类,需实现ElasticJob接口,脚本型作业不需要配置
sharding-item-parametersString分片序列号和参数用等号分隔,多个键值对用逗号分隔分片序列号从0开始,不可大于或等于作业分片总数如:
0=a,1=b,2=c
job-parameterString作业自定义参数
代码中通过shardingContext.getJobParameter()获取
monitor-executionbooleantrue监控作业运行时状态
每次作业执行时间和间隔时间均非常短的情况,建议不监控作业运行时状态以提升效率。因为是瞬时状态,所以无必要监控。请用户自行增加数据堆积监控。并且不能保证数据重复选取,应在作业中实现幂等性。
每次作业执行时间和间隔时间均较长的情况,建议监控作业运行时状态,可保证数据不会重复选取。
monitor-portint-1作业监控端口
max-time-diff-secondsint-1最大允许的本机与注册中心的时间误差秒数
如果时间误差超过配置秒数则作业启动时将抛异常
配置为-1表示不校验时间误差
failoverbooleanfalse是否开启失效转移
仅monitorExecution开启,失效转移才有效
misfirebooleantrue是否开启错过任务重新执行
descriptionString作业描述信息
disabledbooleanfalse作业是否禁止启动
可用于部署作业时,先禁止启动,部署结束后统一启动
overwritebooleanfalse本地配置是否可覆盖注册中心配置
建议覆盖避免配置修改后不生效
Elastic-Job是ddframe中dd-job作业模块中分离出来的分布式弹性作业框架。去掉了和dd-job中的监控和ddframe接入规范部分。该项目基于成熟的开源产品Quartz和Zookeeper及其客户端Curator进行二次开发。       ddframe其他模块也有可独立开源的部分,之前当当曾开源过dd-soa的基石模块DubboX。elastic-job和ddframe关系见下图Elastic-Job 主要功能定时任务: 基于成熟的定时任务作业框架Quartz cron表达式执行定时任务作业注册中心: 基于Zookeeper和其客户端Curator实现的全局作业注册控制中心。用于注册,控制和协调分布式作业执行。作业分片: 将一个任务分片成为多个小任务项在多服务器上同时执行。弹性扩容缩容: 运行中的作业服务器崩溃,或新增加n台作业服务器,作业框架将在下次作业执行前重新分片,不影响当前作业执行。支持多种作业执行模式: 支持OneOff,Perpetual和SequencePerpetual三种作业模式。失效转移: 运行中的作业服务器崩溃不会导致重新分片,只会在下次作业启动时分片。启用失效转移功能可以在本次作业执行过程中,监测其他作业服务器空闲,抓取未完成的孤儿分片项执行。运行时状态收集: 监控作业运行时状态,统计最近一段时间处理的数据成功和失败数量,记录作业上次运行开始时间,结束时间和下次运行时间。作业停止,恢复和禁用:用于操作作业启停,并可以禁止某作业运行(上线时常用)。被错过执行的作业重触发:自动记录错过执行的作业,并在上次作业完成后自动触发。可参考Quartz的misfire。多线程快速处理数据:使用多线程处理抓取到的数据,提升吞吐量。幂等性:重复作业任务项判定,不重复执行已运行的作业任务项。由于开启幂等性需要监听作业运行状态,对瞬时反复运行的作业对性能有较大影响。容错处理:作业服务器与Zookeeper服务器通信失败则立即停止作业运行,防止作业注册中心将失效的分片分项配给其他作业服务器,而当前作业服务器仍在执行任务,导致重复执行。Spring支持:支持spring容器,自定义命名空间,支持占位符。运维平台:提供运维界面,可以管理作业和注册中心。相关文档下载Release Notes1.0.2接口变更声明何为分布式作业?目录结构说明使用步骤开发指南使用限制运维平台阅读源码编译问题说明实现原理作业分片策略监控快速上手(感谢第三方志愿者 泽伟@心探索科技 提供文档)InfoQ新闻Elastic-Job Wiki (由社区志愿者自由编辑的) 标签:作业调度
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

zhibo_lv

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值