一、elastic job 2.1.5 较之前的版本改动了在zookeeper上的信息,zk上的存储和相关说明如下图:
二、elasticjob的基本概念
1、每个作业进程都对应一个JobInstance,存储在JobRegistry中
一个instance就是运行此job分片的一个进程,instanceid由ip+进程号组成。
JobName -> JobInstance
JobName -> shardtotalNumber(该job分片的总数)
JobName -> 作业是否运行
JobName -> JobScheduleController(作业调度控制器)
JobName -> CoordinaryRegistryCenter(注册中心)
2、主节点选举触发
a、主节点down机
b、主节点机器设置为disable
3、重新分片触发
a、config的分片总数发生了变化
b、节点down
4、failover的触发
a、节点down,运行在这个instanceid上的分片或者已经failover的分片会重新标记成failover
b、关于failover的配置改变设置为false,删除failover的相关信息
监听到failover的节点如果当前没有要运行的作业,则直接抓取failover的分片执行。
5、在instanceid上添加TRIGGER,可以出发当前的instance上的job运行(前提是此instance上的job不在运行中)。
6、配置改变会从新调度作业。
7、与zookeeper之间的连接丢失会停止作业调度,等待连接恢复会重新调度。
三、启动流程如下图:
JobScheduleController就是封装了quartz的调度信息。
四、作业分片流程如下图:
五、获取要执行的分片流程如下图:
六、作业执行流程如下图:
七、总结
以上文章都是根据elasticjob2.1.5的源码所写,具体细节还得看源代码。有不足之处还望指正。