Elastic-Job开发指南

最新推荐文章于 2024-08-22 08:41:01 发布

aoxida

最新推荐文章于 2024-08-22 08:41:01 发布

阅读量1.4k

点赞数

分类专栏：分布式 elastic-Job quartz 文章标签： elastic-Job

原文链接：https://www.51dev.com/cplus/20702

版权

分布式同时被 3 个专栏收录

7 篇文章 1 订阅

订阅专栏

elastic-Job

2 篇文章 0 订阅

订阅专栏

quartz

1 篇文章 0 订阅

订阅专栏

大多数情况下，定时任务我们一般使用quartz开源框架就能满足应用场景。但如果考虑到健壮性等其它一些因素，就需要自己下点工夫，比如：要避免单点故障，至少得部署2个节点吧，但是部署多个节点，又有其它问题，有些数据在某一个时刻只能处理一次，比如 i = i+1 这些无法保证幂等的操作，run多次跟run一次，完全是不同的效果。对于上面的问题，我曾经自行设计过一个基于zk分布式锁的解决方案： 1、每类定时job，可以分配一个独立的标识（比如：xxx_job) 2、这类job的实例，部署在多个节点上时，每个节点启动前，向zk申请一个分布式锁（在xxx_job节点下） 3、拿到锁的实例，才允许启动定时任务(通过代码控制quartz的schedule)，没拿到锁的，处于standby状态，一直监听锁的变化 4、如果某个节点挂了，分布式锁自动释放，其它节点这时会抢到锁，按上面的逻辑，就会从standby状态，转为激活状态，小三正式上位，继续执行定时job。这个方案，基本上解决了HA和业务正确性的问题，但是美中不足的地方有2点： 1、无法充分利用机器性能，处于standby的节点，实际上只是一个备胎，平时啥也不干 2、性能不方便扩展，比如：某个job一次要处理上千万的数据，仅1个激活节点，要处理很久好了，前戏铺垫了这么久，该请主角登场了，elastic-job相当于quartz+zk的加强版，它允许对定时任务分片，可以集群部署(每个job的"分片"会分散到各个节点上)，如果某个节点挂了，该节点上的分片，会调度到其它节点上。官网上有比较详细的教程，一般情况下，使用SimpleJob这种就可以了。使用步骤：前提：要先添加下面二个jar的依赖

compile "com.dangdang:elastic-job-lite-core:2.1.5"
compile "com.dangdang:elastic-job-lite-spring:2.1.5"

1、自己的job要继承自SimpleJob，然后实现void execute(ShardingContext shardingContext)。

public interface SimpleJob extends ElasticJob {
    
    /**
     * 执行作业.
     *
     * @param shardingContext 分片上下文
     */
    void execute(ShardingContext shardingContext);
}

注意这里面有一个shardingContext参数，看下源码：

/**
 * 分片上下文.
 * 
 * @author zhangliang
 */
@Getter
@ToString
public final class ShardingContext {
    
    /**
     * 作业名称.
     */
    private final String jobName;
    
    /**
     * 作业任务ID.
     */
    private final String taskId;
    
    /**
     * 分片总数.
     */
    private final int shardingTotalCount;
    
    /**
     * 作业自定义参数.
     * 可以配置多个相同的作业, 但是用不同的参数作为不同的调度实例.
     */
    private final String jobParameter;
    
    /**
     * 分配于本作业实例的分片项.
     */
    private final int shardingItem;
    
    /**
     * 分配于本作业实例的分片参数.
     */
    private final String shardingParameter;
    
    public ShardingContext(final ShardingContexts shardingContexts, final int shardingItem) {
        jobName = shardingContexts.getJobName();
        taskId = shardingContexts.getTaskId();
        shardingTotalCount = shardingContexts.getShardingTotalCount();
        jobParameter = shardingContexts.getJobParameter();
        this.shardingItem = shardingItem;
        shardingParameter = shardingContexts.getShardingItemParameters().get(shardingItem);
    }
}

这里面有2个很重要的属性：shardingTotalCount 分片总数(比如：2)、shardingItem 当前分片索引(比如：1)，前面提到的性能扩容，就可以根据2个参数进行简单的处理，假设在电商系统中，每天晚上有个定时任务，要统计每家店的销量。商家id一般在表设计上是一个自增数字，如果总共2个分片(注：通常也就是部署2个节点)，可以把 id为奇数的放到分片0，id为偶数的放到分片1，这样2个机器各跑一半，相对只有1台机器而言，就快多了。

伪代码如下：

public class TestJob implements SimpleJob {
    @Override
    public void execute(ShardingContext shardingContext) {
        int shardIndx = shardingContext.getShardingItem();
        if (shardIndx == 0) {
            //处理id为奇数的商家
        } else {
            //处理id为偶数的商家
        }
    }
}

这个还可以进一步简化，如果使用mysql查询商家列表，mysql中有一个mod函数，直接可以对商家id进行取模运算

select * from shop where mod(shop_id,2)=0

如果把上面的2、0换成参数，mybatis中类似这样：

select * from shop where mod(shop_id,#{shardTotal})=#{shardIndex}

这样逻辑就转换到sql中处理了，java代码中把参数传进来就行，连if都可以省掉。

2、接下来看看如何配置

<?xml version="1.0" encoding="UTF-8"?>
<beans xmlns="http://www.springframework.org/schema/beans"
       xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
       xmlns:reg="http://www.dangdang.com/schema/ddframe/reg"
       xmlns:job="http://www.dangdang.com/schema/ddframe/job"
       xsi:schemaLocation="http://www.springframework.org/schema/beans
       http://www.springframework.org/schema/beans/spring-beans.xsd
       http://www.dangdang.com/schema/ddframe/reg
       http://www.dangdang.com/schema/ddframe/reg/reg.xsd
       http://www.dangdang.com/schema/ddframe/job
       http://www.dangdang.com/schema/ddframe/job/job.xsd">

    <reg:zookeeper id="regCenter" server-lists="${zk_address}" namespace="my-xxx-job"
                   base-sleep-time-milliseconds="1000"
                   max-sleep-time-milliseconds="3000" max-retries="3"/>

    <job:simple id="xxxJob" class="com.cnblogs.yjmyzz.XXXJob" registry-center-ref="regCenter"
                cron="${xxxJob_cornExpress}"
                sharding-total-count="2" sharding-item-parameters="0=A,1=B"/>

                ...
</beans>

与常规的spring配置几乎没啥区别，几个要点如下：

a) 因为分片调度是基于zk的，所以要先配置zk注册中心，其中${zk_address}大家可以改成实际的zk地址列表，比如：10.x.x.1:2181,10.x.x.2:2181,10.x.x.3:2181　

b) 每个job中的corn属性，就是quartz中的cornExpress表达式，然后sharding-total-count即总分片数，而sharding-item-parameters则是指定每个分片中的具体参数

（注：刚才的电商每天晚上算销量，这个case其实只用到了分片索引、分片数，并不需要参数，所以这里随便配置一个类似0=A, 1=B就可以了，如果有些业务场景，希望在知道分片索引的同时，还希望额外传一些参数进来，就可以在这里配置你希望的参数，然后在execute中，也能读到相应的参数）

3、控制台

elastic-job还提供了一个不错的UI控制台，项目源代码git clone到本地，mvn install就能得到一个elastic-job-lite-console-${version}.tar.gz的包，解压，然后运行里面的bin/start.sh 就能跑起来，界面类似如下：

通过这个控制台，可以动态调整每个定时任务的触发时间(即：cornExpress)。详情可参考官网文档-运维平台部分。

4、与spring-cloud/spring-boot的整合

如果是传统的spring项目，按上面的步骤就可以无缝整合了，如果是spring-cloud/spring-boot，则稍微要复杂点。

由于spring-boot倡导零xml配置，所以大部分配置就用代码替代了，先定义一个elasticJob的配置类：

@Data
@Configuration
public class ElasticJobConfig {

    @Value("${rxQuartz.app.zkAddress}")
    private String zkNodes;

    @Value("${rxQuartz.app.namespace}")
    private String namespace;

    @Bean
    public ZookeeperConfiguration zkConfig() {
        return new ZookeeperConfiguration(zkNodes, namespace);
    }

    @Bean(initMethod = "init")
    public ZookeeperRegistryCenter regCenter(ZookeeperConfiguration config) {
        return new ZookeeperRegistryCenter(config);
    }
}

上面这段代码，主要是解决zk注册中心的注入问题，然后各种xxxJob，由于要让spring自动注入，需要打上component注解

@Component("xxxJob")
public class XXXJob extends AbstractJob {
   
    ...
}

然后在真正要用的地方，把他们组装起来

import com.dangdang.ddframe.job.api.simple.SimpleJob;
import com.dangdang.ddframe.job.config.JobCoreConfiguration;
import com.dangdang.ddframe.job.config.simple.SimpleJobConfiguration;
import com.dangdang.ddframe.job.lite.api.JobScheduler;
import com.dangdang.ddframe.job.lite.config.LiteJobConfiguration;
import com.dangdang.ddframe.job.lite.spring.api.SpringJobScheduler;
import com.dangdang.ddframe.job.reg.zookeeper.ZookeeperRegistryCenter;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.beans.factory.annotation.Qualifier;
import org.springframework.beans.factory.annotation.Value;
import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;

/**
 * @author: yangjunming
 */
@Configuration
public class ElasticJobs {

    @Autowired
    @Qualifier("xxxJob")
    public SimpleJob xxxJob;
   
    @Autowired
    private ZookeeperRegistryCenter regCenter;

    @Bean(initMethod = "init")
    public JobScheduler settlementJobScheduler(@Autowired @Qualifier("xxxJob") SimpleJob simpleJob,
                                               @Value("${xxxJob.billCronExpress}") final String cron,
                                               @Value("${xxxJob.shardingCount}") int shardingCount,
                                               @Value("${xxxJob.shardingItemParameters}") String shardingItemParameters) {
        return new SpringJobScheduler(simpleJob, regCenter, getLiteJobConfiguration(simpleJob.getClass(), cron, shardingCount, shardingItemParameters));
    }

    private LiteJobConfiguration getLiteJobConfiguration(final Class<? extends SimpleJob> jobClass, final String cron, final int shardingTotalCount, final String shardingItemParameters) {
        return LiteJobConfiguration.newBuilder(new SimpleJobConfiguration(JobCoreConfiguration.newBuilder(
                jobClass.getName(), cron, shardingTotalCount).shardingItemParameters(shardingItemParameters).build(), jobClass.getCanonicalName())).overwrite(true).build();
    }
}

job:simple命名空间属性详细说明

属性名	类型	是否必填	缺省值	描述
id	String	`是`		作业名称
class	String	否		作业实现类，需实现`ElasticJob`接口，脚本型作业不需要配置
registry-center-ref	String	`是`		注册中心`Bean`的引用，需引用`reg:zookeeper`的声明
cron	String	`是`		`cron`表达式，用于配置作业触发时间
sharding-total-count	int	`是`		作业分片总数
sharding-item-parameters	String	否		分片序列号和参数用等号分隔，多个键值对用逗号分隔分片序列号从`0`开始，不可大于或等于作业分片总数如： `0=a,1=b,2=c`
job-parameter	String	否		作业自定义参数可以配置多个相同的作业，但是用不同的参数作为不同的调度实例
monitor-execution	boolean	否	true	监控作业运行时状态每次作业执行时间和间隔时间均非常短的情况，建议不监控作业运行时状态以提升效率。因为是瞬时状态，所以无必要监控。请用户自行增加数据堆积监控。并且不能保证数据重复选取，应在作业中实现幂等性。每次作业执行时间和间隔时间均较长的情况，建议监控作业运行时状态，可保证数据不会重复选取。
monitor-port	int	否	-1	作业监控端口建议配置作业监控端口, 方便开发者dump作业信息。使用方法: echo “dump” \| nc 127.0.0.1 9888
max-time-diff-seconds	int	否	-1	最大允许的本机与注册中心的时间误差秒数如果时间误差超过配置秒数则作业启动时将抛异常配置为`-1`表示不校验时间误差
failover	boolean	否	false	是否开启失效转移仅`monitorExecution`开启，失效转移才有效
misfire	boolean	否	true	是否开启错过任务重新执行
job-sharding-strategy-class	String	否	true	作业分片策略实现类全路径默认使用平均分配策略详情参见：作业分片策略
description	String	否		作业描述信息
disabled	boolean	否	false	作业是否禁止启动可用于部署作业时，先禁止启动，部署结束后统一启动
overwrite	boolean	否	false	本地配置是否可覆盖注册中心配置如果可覆盖，每次启动作业都以本地配置为准

job:dataflow命名空间属性详细说明

job:dataflow命名空间拥有job:simple命名空间的全部属性，以下仅列出特有属性

属性名	类型	是否必填	缺省值	描述
process-count-interval-seconds	int	否	300	统计作业处理数据数量的间隔时间单位：秒
concurrent-data-process-thread-count	int	否	CPU核数*2	同时处理数据的并发线程数不能小于1 仅`ThroughputDataFlow`作业有效
fetch-data-count	int	否	1	每次抓取的数据量
streaming-process	boolean	否	false	是否流式处理数据如果流式处理数据, 则`fetchData`不返回空结果将持续执行作业如果非流式处理数据, 则处理数据完成后作业结束

job:script命名空间属性详细说明，基本属性参照job:simple命名空间属性详细说明

job:script命名空间拥有job:simple命名空间的全部属性，以下仅列出特有属性

属性名	类型	是否必填	缺省值	描述
script-command-line	String	否		脚本型作业执行命令行

job:listener命名空间属性详细说明

job:listener必须配置为job:bean的子元素

属性名	类型	是否必填	缺省值	描述
class	String	`是`		前置后置任务监听实现类，需实现`ElasticJobListener`接口
started-timeout-milliseconds	long	`否`	Long.MAX_VALUE	AbstractDistributeOnceElasticJobListener型监听器，最后一个作业执行前的执行方法的超时时间单位：毫秒
completed-timeout-milliseconds	long	`否`	Long.MAX_VALUE	AbstractDistributeOnceElasticJobListener型监听器，最后一个作业执行后的执行方法的超时时间单位：毫秒

reg:bean命名空间属性详细说明

属性名	类型	是否必填	缺省值	描述
id	String	`是`		注册中心在`Spring`容器中的主键
server-lists	String	`是`		连接`Zookeeper`服务器的列表包括IP地址和端口号多个地址用逗号分隔如: host1:2181,host2:2181
namespace	String	`是`		`Zookeeper`的命名空间
base-sleep-time-milliseconds	int	否	1000	等待重试的间隔时间的初始值单位：毫秒
max-sleep-time-milliseconds	int	否	3000	等待重试的间隔时间的最大值单位：毫秒
max-retries	int	否	3	最大重试次数
session-timeout-milliseconds	int	否	60000	会话超时时间单位：毫秒
connection-timeout-milliseconds	int	否	15000	连接超时时间单位：毫秒
digest	String	否	无验证	连接`Zookeeper`的权限令牌缺省为不需要权限验证