分布式调试问题

最新推荐文章于 2024-07-09 03:45:00 发布

NaShiYu

最新推荐文章于 2024-07-09 03:45:00 发布

阅读量660

点赞数

分类专栏： Cluster模式潜在问题|Web服务综合解决方案文章标签：分布式队列

本文链接：https://blog.csdn.net/NaShiYu/article/details/111875984

版权

Cluster模式潜在问题|Web服务综合解决方案专栏收录该内容

5 篇文章 0 订阅

订阅专栏

分布时调试，即在分布式环境下定时任务的处理

一、定时任务的场景

定时任务：每隔一定时间/特定某一时间执行

订单审核、出库
订单超时⾃动取消、⽀付退款
礼券同步、⽣成、发放作业
物流信息推送、抓取作业、退换货处理作业
数据积压监控、⽇志监控、服务可⽤性探测作业
定时备份数据
⾦融系统每天的定时结算
数据归档、清理作业
报表、离线数据分析作业

二、分布式调度

含义包含两层

运行在分布式集群环境下的调试任务（同一个定时任务，程序部署多份，同一时刻只有一个定时任务在执行）
分布式调度 -> 定时任务的分布式-> 定时任务的拆分(即为把⼀个⼤的作业任务拆分为多个⼩的作业任务，同时执⾏)

三、定时任务与消息队列的区别

共同点

异步处理

比如注册、下单事件

应用解耦

不管定时任务作业还是MQ都可以作为两个应⽤之间的⻮轮实现应⽤解耦，这个⻮轮可以中转数据，当然单体服务不需要考虑这些，服务拆分的时候往往都会考虑

流量削峰

双⼗⼀的时候，任务作业和MQ都可以⽤来扛流量，后端系统根据服务能⼒定时处理订单或者从MQ抓取订单抓取到⼀个订单到来事件的话触发处理，对于前端⽤户来说看到的结果是已经下单成功了，下单是不受任何影响的

不同点

定时任务作业是时间驱动，⽽MQ是事件驱动；
时间驱动是不可代替的，⽐如⾦融系统每⽇的利息结算，不是说利息来⼀条（利息到来事件）就算⼀下，⽽往往是通过定时任务批量计算；
所以，定时任务作业更倾向于批处理， MQ倾向于逐条处理

四、定时任务的实现方式

任务调度框架Quartz

import org.quartz.*;
import org.quartz.impl.StdSchedulerFactory;

/**
 * @description Quartz简单示例
 */
public class QuartzMan {

    /**
     * 创建任务调试器
     * @return
     * @throws SchedulerException
     */
    private static Scheduler createScheduler() throws SchedulerException {
        SchedulerFactory schedulerFactory = new StdSchedulerFactory();
        return schedulerFactory.getScheduler();
    }

    /**
     *  创建一个任务
     * @return
     */
    private static JobDetail createJob(){
        JobBuilder jobBuilder = JobBuilder.newJob(YaronJob.class);
        jobBuilder.withIdentity("jobName","YaronYunJob");
        return jobBuilder.build();
    }

    /**
     * 3、创建任务的时间触发器
     *
     * cron表达式由七个位置组成，空格分隔
     * 1、Seconds（秒）  0~59
     * 2、Minutes（分）  0~59
     * 3、Hours（小时）  0~23
     * 4、Day of Month（天）1~31,注意有的月份不足31天
     * 5、Month（月） 0~11,或者 JAN,FEB,MAR,APR,MAY,JUN,JUL,AUG,SEP,OCT,NOV,DEC
     * 6、Day of Week(周)  1~7,1=SUN或者  SUN,MON,TUE,WEB,THU,FRI,SAT
     * 7、Year（年）1970~2099  可选项
     *示例：
     * 0 0 11 * * ? 每天的11点触发执行一次
     * 0 30 10 1 * ? 每月1号上午10点半触发执行一次
     */
    private static Trigger createTrigger(){
        CronTrigger trigger = TriggerBuilder.newTrigger()
                .withIdentity("triggerName","YaronYunTrigger")
                .startNow()
                .withSchedule(CronScheduleBuilder.cronSchedule("*/1 * * * * ?")).build();
        return trigger;
    }

    public static void main(String[] args) throws Exception {
        // 1. 创建任务调试器  
        Scheduler scheduler = createScheduler();
        // 2. 创建一个任务   
        JobDetail job = createJob();
        // 3. 创建任务的时间触发器 
        Trigger trigger = createTrigger();
        // 4. 使用  任务调试器  根据 时间触发器  执行任务
        scheduler.scheduleJob(job,trigger);
        scheduler.start();
    }
}

import org.quartz.Job;
import org.quartz.JobExecutionContext;
import org.quartz.JobExecutionException;

import java.text.SimpleDateFormat;
import java.util.Date;

/**
 * @description 具体的任务类
 */
public class YaronJob implements Job {
    private static final SimpleDateFormat sdf = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
    @Override
    public void execute(JobExecutionContext jobExecutionContext) throws JobExecutionException {
        System.out.println("当前时间是: " + sdf.format(new Date()));
    }
}

五、分布式调度框架Elastic-Job

Elastic-Job是当当⽹开源的⼀个分布式调度解决⽅案，基于Quartz⼆次开发的,由两个相互独⽴的⼦项⽬Elastic-Job-Lite和Elastic-Job-Cloud组成. Elastic-Job-Lite定位为轻量级⽆中⼼化解决⽅案，使⽤Jar包的形式提供分布式任务的协调服务，⽽Elastic-Job-Cloud⼦项⽬需要结合Mesos以及Docker在云环境下使⽤
github地址： https://github.com/elasticjob

maven坐标

<dependency>
     <groupId>com.dangdang</groupId>
     <artifactId>elastic-job-lite-core</artifactId>
      <version>2.1.5</version>
</dependency>

1. 主要功能

分布式调度协调

在分布式环境中，任务能够按指定的调度策略执⾏，并且能够避免同⼀任务多实例重复执⾏

丰富的调度策略

基于成熟的定时任务作业框架Quartz cron表达式执⾏定时任务

弹性扩容缩容

当集群中增加某⼀个实例，它应当也能够被选举并执⾏任务；当集群减少⼀个实例时，它所执⾏的任务能被转移到别的实例来执⾏。

失效转移

某实例在任务执⾏失败后，会被转移到其他实例执⾏

错过执⾏作业重触发

若因某种原因导致作业错过执⾏，⾃动记录错过执⾏的作业，并在上次作业完成后⾃动触发。

⽀持并⾏调度

⽀持任务分⽚，任务分⽚是指将⼀个任务分为多个⼩任务项在多个实例同时执⾏。

作业分⽚⼀致性

当任务被分⽚后，保证同⼀分⽚在分布式环境中仅⼀个执⾏实例

2. 定时任务举例

需求：每隔两秒钟执⾏⼀次定时任务（resume表中未归档的数据归档到resume_bak表中，每次归档1条记录）

1） resume_bak和resume表结构完全⼀样
2） resume表中数据归档之后不删除，只将state置为"已归档"

数据准备

DROP TABLE IF EXISTS `resume`;

CREATE TABLE `resume` (
`id` bigint(20) NOT NULL AUTO_INCREMENT,
`name` varchar(255) DEFAULT NULL,
`sex` varchar(255) DEFAULT NULL,
`phone` varchar(255) DEFAULT NULL,
`address` varchar(255) DEFAULT NULL,
`education` varchar(255) DEFAULT NULL,
`state` varchar(255) DEFAULT NULL,
PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=1001 DEFAULT CHARSET=utf8;

SET FOREIGN_KEY_CHECKS = 1;

DROP TABLE IF EXISTS `resume_bak`;

CREATE TABLE `resume_bak` (
`id` bigint(20) NOT NULL AUTO_INCREMENT,
`name` varchar(255) DEFAULT NULL,
`sex` varchar(255) DEFAULT NULL,
`phone` varchar(255) DEFAULT NULL,
`address` varchar(255) DEFAULT NULL,
`education` varchar(255) DEFAULT NULL,
`state` varchar(255) DEFAULT NULL,
PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=1001 DEFAULT CHARSET=utf8;

代码介绍
JdbcUtil JDBC操作
InsertResumeData 数据准备
ArchivieJob ElasticJobLite定时任务业务逻辑
ElasticJobMain ElasticJob主类

import java.sql.*;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
import java.util.Map;

/**
 * @description JDBC操作
 */
public class JdbcUtil {
    //url
    private static String url = "jdbc:mysql://localhost:3306/job?characterEncoding=utf8&useSSL=false";
    //user
    private static String user = "root";
    //password
    private static String password = "123456";
    //驱动程序类
    private static String driver = "com.mysql.jdbc.Driver";

    static {
        try {
            Class.forName(driver);
        } catch (ClassNotFoundException e) {
            e.printStackTrace();
        }
    }
    public static Connection getConnection() {
        try {
            return DriverManager.getConnection(url, user,password);
        }
        catch (SQLException e) {
            e.printStackTrace();
        }
        return null;
    }

    public static void close(ResultSet rs, PreparedStatement ps,
                             Connection con) {
        if (rs != null) {
            try {
                rs.close();
            } catch (SQLException e) {
                e.printStackTrace();
            } finally {
                if (ps != null) {
                    try {
                        ps.close();
                    } catch (SQLException e) {
                        e.printStackTrace();
                    } finally {
                        if (con != null) {
                            try {
                                con.close();
                            } catch (SQLException e) {
                                e.printStackTrace();
                            }
                        }
                    }
                }
            }
        }
    }

    public static void executeUpdate(String sql,Object...obj) {
        Connection con = getConnection();
        PreparedStatement ps = null;
        try {
            ps = con.prepareStatement(sql);
            for (int i = 0; i < obj.length; i++) {
                ps.setObject(i + 1, obj[i]);
            }
            ps.executeUpdate();} catch (SQLException e) {
            e.printStackTrace();
        } finally {
            close(null, ps, con);
        }
    }
    public static List<Map<String,Object>> executeQuery(String sql, Object...obj) {
        Connection con = getConnection();
        ResultSet rs = null;
        PreparedStatement ps = null;
        try {
            ps = con.prepareStatement(sql);
            for (int i = 0; i < obj.length; i++) {
                ps.setObject(i + 1, obj[i]);
            }
            rs = ps.executeQuery();
            List<Map<String, Object>> list = new ArrayList<>();
            int count = rs.getMetaData().getColumnCount();
            while (rs.next()) {
                Map<String, Object> map = new HashMap<String,
                                        Object>();
                for (int i = 0; i < count; i++) {
                    Object ob = rs.getObject(i + 1);
                    String key = rs.getMetaData().getColumnName(i
                            + 1);
                    map.put(key, ob);
                }
                list.add(map);
            }
            return list;
        } catch (SQLException e) {
            e.printStackTrace();
        } finally {
            close(rs, ps, con);
        }
        return null;
    }
}

import java.sql.Connection;
import java.sql.PreparedStatement;
import java.util.Arrays;
import java.util.List;
import java.util.Random;

/**
 * @description 数据准备
 */
public class InsertResumeData {

    public static void main(String[] args) throws Exception{
        Connection connection = JdbcUtil.getConnection();
        Random random = new Random();
        List<String> nameList = Arrays.asList("王小虎","张力","张小二","王总","李雪玲","范宝宝","弦子");
        int nameLen = nameList.size();

        List<String> sexList = Arrays.asList("男","女","你懂的");
        int sexLen = sexList.size();

        List<String> addressList = Arrays.asList("北京","上海","成都","郑州","昌都","呼伦贝尔");
        int addressLen = addressList.size();

        List<String> educationList = Arrays.asList("小学","初中","高中","本科","硕士");
        int educationLen = educationList.size();

        String state = "未归档";
        PreparedStatement preparedStatement = null;

        for (int times = 0; times < 1000; times++) {
            String name = nameList.get(random.nextInt(nameLen)) + random.nextInt(1000);
            String sex = sexList.get(random.nextInt(sexLen));
            StringBuffer phoneBuiler = new StringBuffer();
            for (int i = 0; i < 12; i++) {
                phoneBuiler.append(random.nextInt(10));
            }
            String phone = phoneBuiler.toString();
            String address = addressList.get(random.nextInt(addressLen));
            String education = educationList.get(random.nextInt(educationLen));

            preparedStatement = connection.prepareStatement("insert into resume(name,sex,phone,address,education,state) values (?,?,?,?,?,?)");

            preparedStatement.setString(1, name);
            preparedStatement.setString(2, sex);
            preparedStatement.setString(3, phone);
            preparedStatement.setString(4, address);
            preparedStatement.setString(5, education);
            preparedStatement.setString(6, state);

            preparedStatement.execute();
        }
    }
}

生成的数据部分如下

mport com.dangdang.ddframe.job.api.ShardingContext;
import com.dangdang.ddframe.job.api.simple.SimpleJob;
import java.util.List;
import java.util.Map;

/**
 * @description ElasticJobLite定时任务业务逻辑
 */
public class ArchivieJob implements SimpleJob {

    /**
     * 任务详情  resume表中未归档的数据归档到resume_bak表中，每次归档1条记录
     * @param shardingContext
     */
    @Override
    public void execute(ShardingContext shardingContext) {

        int shardingItem = shardingContext.getShardingItem();
        System.out.println("--------------> 当前分片: "+ shardingItem);

        // 根据 学历 education的不同，来让不同的分片去处理数据
        String educationParam = shardingContext.getShardingParameter();

        // 1. 从resum表中查询出 未归档的记录
        String selectSql = String.format("select * from resume where state = '%s' and education = '%s' limit 1","未归档",educationParam);
        List<Map<String, Object>> mapList = JdbcUtil.executeQuery(selectSql);
        if (null == mapList || 0 == mapList.size()){
            System.out.println("数据已经 处理完毕!");
            return;
        }
        Map<String, Object> stringObjectMap = mapList.get(0);
        long id = (long)stringObjectMap.get("id");
        String name = String.valueOf(stringObjectMap.get("name"));
        String education = String.valueOf(stringObjectMap.get("education"));
        System.out.println("id: "+ id+"\tname: "+name+"\teducation:"+education);

        // 2. "未归档"  -> 归档
        String updateSql = String.format("update resume set state='%s' where id=?","已归档");
        JdbcUtil.executeUpdate(updateSql,id);

        // 3. 归档这条记录，把这条记录插入 resume_bak表中
        String insertSql = "insert into resume_bak select * from resume where id =?";
        JdbcUtil.executeUpdate(insertSql,id);
    }
}

import com.dangdang.ddframe.job.config.JobCoreConfiguration;
import com.dangdang.ddframe.job.config.simple.SimpleJobConfiguration;
import com.dangdang.ddframe.job.lite.api.JobScheduler;
import com.dangdang.ddframe.job.lite.config.LiteJobConfiguration;
import com.dangdang.ddframe.job.reg.base.CoordinatorRegistryCenter;
import com.dangdang.ddframe.job.reg.zookeeper.ZookeeperConfiguration;
import com.dangdang.ddframe.job.reg.zookeeper.ZookeeperRegistryCenter;

/**
 * @description ElasticJob主类
 */
public class ElasticJobMain {

    public static void main(String[] args) {
        // 配置 分布式协调服务(注册中心)
        ZookeeperConfiguration zkConf =
                new ZookeeperConfiguration("127.0.0.1:2181","archivieJob-zk-job");
        CoordinatorRegistryCenter resCenter = new ZookeeperRegistryCenter(zkConf);
        resCenter.init();

        // 配置任务（时间事件 定时任务业务逻辑 调试器）
        // shardingItemParameters 分片参数,用来说明哪个分片 说明 哪个任务
        JobCoreConfiguration jobConf = JobCoreConfiguration.newBuilder("archive-job", "*/2 * * * * ?",
                5)
                .shardingItemParameters(
                        String.format("0=%s,1=%s,2=%s,3=%s,4=%s","小学","初中","高中","本科","硕士")
                ).build();
        SimpleJobConfiguration simpleJobConfiguration = new SimpleJobConfiguration(jobConf, ArchivieJob.class.getName());

        // overwrite(true) 当zk变化时，会进行配置的覆盖
        JobScheduler jobScheduler = new JobScheduler(resCenter,
                LiteJobConfiguration.newBuilder(simpleJobConfiguration)
                        .overwrite(true).build());
        jobScheduler.init();
    }
}

测试
1）可先启动⼀个进程，然后再启动⼀个进程（两个进程模拟分布式环境下，通⼀个定时任务部署了两份在⼯作）
2）两个进程逐个启动，观察现象

初始化时所有分片的任务都集中到开启的实例中，在开启另一个实例后，分片任务会分配到新启动的实例上，两个实例运行的任务不相同，这就保证了任务不会被重复运行
3）关闭其中执⾏的进程，观察现象

现象和2)类似

Leader节点选举机制

每个Elastic-Job的任务执⾏实例App作为Zookeeper的客户端来操作ZooKeeper的znode
（1）多个实例同时创建/leader节点
（2） /leader节点只能创建⼀个，后创建的会失败，创建成功的实例会被选为leader节点，执⾏任务

Elastic-Job的任务分片机制说明

ElasticJob可以把作业分为多个的task（每⼀个task就是⼀个任务分⽚），每⼀个task交给具体的⼀个机器实例去处理（⼀个机器实例是可以处理多个task的），但是具体每个task执⾏什么逻辑由我们⾃⼰来指定上述 ArchivieJob 代码中可见分片的设置
Strategy策略定义这些分⽚项怎么去分配到各个机器上去，默认是平均去分，可以定制，⽐如某⼀个机器负载⽐较⾼或者预配置⽐较⾼，那么就可以写策略。分⽚和作业本身是通过⼀个注册中⼼协调的，因为在分布式环境下，状态数据肯定集中到⼀点，才可以在分布式中沟通

注意：
1）分⽚项也是⼀个JOB配置，修改配置，重新分⽚，在下⼀次定时运⾏之前会重新调⽤分⽚算法，那么这个分⽚算法的结果就是：哪台机器运⾏哪⼀个⼀⽚，这个结果存储到zk中的，主节点会把分⽚给分好放到注册中⼼去，然后执⾏节点从注册中⼼获取信息(执⾏节点在定时任务开启的时候获取相应的分⽚)。
2）如果所有的节点挂掉值剩下⼀个节点，所有分⽚都会指向剩下的⼀个节点，这也是ElasticJob的⾼可⽤。

如下所示启动 zooInspector，观察上述Elastsic-Job的运行情况

当前是启动了3个实例去运行 5 个分片的任务，这5个分片任务会尽可能的平均分配到3个运行实例当中