Cluster模式潜在问题学习笔记---分布式ID问题和解决⽅案

最新推荐文章于 2024-04-21 21:19:06 发布

馒头太帅了

最新推荐文章于 2024-04-21 21:19:06 发布

阅读量340

点赞数

分类专栏： Cluster模式潜在问题

本文链接：https://blog.csdn.net/qq_39314972/article/details/108696287

版权

Cluster模式潜在问题专栏收录该内容

10 篇文章 0 订阅

订阅专栏

Cluster模式潜在问题学习笔记—分布式ID解决⽅案

1.为什么需要分布式ID(分布式集群环境下的全局唯⼀ID)

因为当单表A数据量过多，于是就将单表A拆分成A1表，A2表，A3表，并且表的结构是一样的，但是拆出来的三个表数据的主键id是不能一样的，所以就需要分布式集群环境下的全局唯⼀ID

2. 分布式ID解决⽅案：生成UUID

UUID是指Universally Unique Identifier，翻译为中⽂是通⽤唯⼀识别码，产⽣重复 UUID 并造成错误的情况⾮常低，是故⼤可不必考虑此问题。
Java中得到⼀个UUID，可以使⽤java.util包提供的⽅法,但生成的UUID可能会很长，而且建立主键索引的话由于Id过长，所以性能也不会很好。

代码例子：

public static void main(String[] args) {
    String uuid = UUID.randomUUID().toString();
    System.out.println(uuid);
}

生成的UUID例子:
注意：UUID没有规律，UUID特别长，这两个问题是伴随着UUID出现的

3.独立数据库的自增ID

⽐如A表分表为A1表和A2表，那么肯定不能让A1表和A2表的ID⾃增，那么ID怎么获取呢？
我们可以单独的创建⼀个Mysql数据库，在这个数据库中创建⼀张表，这张表的ID设置为⾃增，其他地⽅需要全局唯⼀ID的时候，就模拟向这个Mysql数据库的这张表中模拟插⼊⼀条记录，此时ID会⾃增，然后我们可以通过Mysql的select last_insert_id() 获取到刚刚这张表中⾃增⽣成的ID.

⽐如，我们创建了⼀个数据库实例global_id_generator，在其中创建了⼀个数据表，表结构如下：

CREATE TABLE `DISTRIBUTE_ID` (
 `id` bigint(32) NOT NULL AUTO_INCREMENT COMMENT '主键',
 `createtime` datetime DEFAULT NULL,
 PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

当分布式集群环境中哪个应⽤需要获取⼀个全局唯⼀的分布式ID的时候，就可以使⽤代码连接这个数据库实例，执⾏如下sql语句即可。
```
insert into DISTRIBUTE_ID(createtime) values(NOW());
select LAST_INSERT_ID()；
```
注意：
1. 这⾥的createtime字段⽆实际意义，是为了随便插⼊⼀条数据以⾄于能够⾃增id。
2. 使⽤独⽴的Mysql实例⽣成分布式id，虽然可⾏，但是性能和可靠性都不够好，因为你需要代码连接到数据库才能获取到id，性能⽆法保障，另外mysql数据库实例挂掉了，那么就⽆法获取分布式id了。
3. 有⼀些开发者⼜针对上述的情况将⽤于⽣成分布式id的mysql数据库设计成了⼀个集群架构，那么其实这种⽅式现在基本不⽤，因为过于麻烦了。

4.产生分布式ID的一种算法—雪花算法

雪花算法是Twitter推出的⼀个⽤于⽣成分布式ID的策略。
雪花算法是⼀个算法，基于这个算法可以⽣成ID，⽣成的ID是⼀个long型，那么在Java中⼀个long型是8个字节，算下来是64bit，如下是使⽤雪花算法⽣成的⼀个ID的⼆进制形式示意(一个字节是8位，所以雪花ID就是一个64位的)：
机器id一共十位，是由两个5位组合起来的，分别是工作ID，数据ID
另外，⼀切互联⽹公司也基于上述的⽅案封装了⼀些分布式ID⽣成器，⽐如滴滴的tinyid（基于数据库实现）、百度的uidgenerator（基于SnowFlake）和美团的leaf（基于数据库和SnowFlake）等。

5.查看雪花算法源码

官方推出，雪花算法是用Scala编程语言来实现的，但是Java前辈用Java语言实现了雪花算法
代码如下：

/**
 * 官方推出，Scala编程语言来实现的
 * Java前辈用Java语言实现了雪花算法
 */
public class IdWorker{

    //下面两个每个5位，加起来就是10位的工作机器id
    private long workerId;    //工作id 不能比31(31是2的5次幂减1) 大也不能比0小
    private long datacenterId;   //数据id 不能比31(31是2的5次幂减1) 大也不能比0小
    //12位的序列号
    private long sequence; //0-4095之间

    public IdWorker(long workerId, long datacenterId, long sequence){
        // sanity check for workerId
        if (workerId > maxWorkerId || workerId < 0) {
            throw new IllegalArgumentException(String.format("worker Id can't be greater than %d or less than 0",maxWorkerId));
        }
        if (datacenterId > maxDatacenterId || datacenterId < 0) {
            throw new IllegalArgumentException(String.format("datacenter Id can't be greater than %d or less than 0",maxDatacenterId));
        }
        System.out.printf("worker starting. timestamp left shift %d, datacenter id bits %d, worker id bits %d, sequence bits %d, workerid %d",
                timestampLeftShift, datacenterIdBits, workerIdBits, sequenceBits, workerId);

        this.workerId = workerId;
        this.datacenterId = datacenterId;
        this.sequence = sequence;
    }

    //初始时间戳
    private long twepoch = 1288834974657L;

    //长度为5位
    private long workerIdBits = 5L;
    private long datacenterIdBits = 5L;
    //最大值
    private long maxWorkerId = -1L ^ (-1L << workerIdBits);
    private long maxDatacenterId = -1L ^ (-1L << datacenterIdBits);
    //序列号id长度
    private long sequenceBits = 12L;
    //序列号最大值
    private long sequenceMask = -1L ^ (-1L << sequenceBits);
    
    //工作id需要左移的位数，12位
    private long workerIdShift = sequenceBits;
   //数据id需要左移位数 12+5=17位
    private long datacenterIdShift = sequenceBits + workerIdBits;
    //时间戳需要左移位数 12+5+5=22位
    private long timestampLeftShift = sequenceBits + workerIdBits + datacenterIdBits;
    
    //上次时间戳，初始值为负数
    private long lastTimestamp = -1L;

    public long getWorkerId(){
        return workerId;
    }

    public long getDatacenterId(){
        return datacenterId;
    }

    public long getTimestamp(){
        return System.currentTimeMillis();
    }

     //下一个ID生成算法
    public synchronized long nextId() {
        long timestamp = timeGen();

        //获取当前时间戳如果小于上次时间戳，则表示时间戳获取出现异常
        if (timestamp < lastTimestamp) {
            System.err.printf("clock is moving backwards.  Rejecting requests until %d.", lastTimestamp);
            throw new RuntimeException(String.format("Clock moved backwards.  Refusing to generate id for %d milliseconds",
                    lastTimestamp - timestamp));
        }

        //获取当前时间戳如果等于上次时间戳
        //说明：还处在同一毫秒内，则在序列号加1；否则序列号赋值为0，从0开始。
        if (lastTimestamp == timestamp) {  // 0  - 4095 (12位最大值)
            sequence = (sequence + 1) & sequenceMask;
            if (sequence == 0) {
                timestamp = tilNextMillis(lastTimestamp);
            }
        } else {
            sequence = 0;
        }
        
        //将上次时间戳值刷新
        lastTimestamp = timestamp;

        /**
          * 返回结果：
          * (timestamp - twepoch) << timestampLeftShift) 表示将时间戳减去初始时间戳，再左移相应位数
          * (datacenterId << datacenterIdShift) 表示将数据id左移相应位数
          * (workerId << workerIdShift) 表示将工作id左移相应位数
          * | 是按位或运算符，例如：x | y，只有当x，y都为0的时候结果才为0，其它情况结果都为1。
          * 因为个部分只有相应位上的值有意义，其它位上都是0，所以将各部分的值进行 | 运算就能得到最终拼接好的id
        */
        return ((timestamp - twepoch) << timestampLeftShift) |
                (datacenterId << datacenterIdShift) |
                (workerId << workerIdShift) |
                sequence;
    }

    //获取时间戳，并与上次时间戳比较
    private long tilNextMillis(long lastTimestamp) {
        long timestamp = timeGen();
        while (timestamp <= lastTimestamp) {
            timestamp = timeGen();
        }
        return timestamp;
    }

    //获取系统时间戳
    private long timeGen(){
        return System.currentTimeMillis();
    }




    public static void main(String[] args) {
        IdWorker worker = new IdWorker(21,10,0);
        for (int i = 0; i < 100; i++) {
            System.out.println(worker.nextId());
        }
    }

}

6.借助Redis的Incr命令获取全局唯⼀ID（推荐）

Redis Incr 命令将 key 中储存的数字值增⼀。如果 key 不存在，那么 key 的值会先被初始化为 0，然后再执⾏ INCR 操作。
Redis中存的是<key,value>的值
设定key是<id,>
每次执行.incr(id) 这个命令，传入不同的id都会返回不同的值
安装redis
1. 官⽹下载redis-3.2.10.tar.gz
2. 上传到linux服务器解压 tar -zxvf redis-3.2.10.tar.gz
3. cd 解压⽂件⽬录，对解压的redis进⾏编译make
4. 然后cd 进⼊src⽬录，执⾏make install
5. 修改解压⽬录中的配置⽂件redis.conf，关掉保护模式，如下图
6. 在src⽬录下执⾏ ./redis-server …/redis.conf 启动redis服务

Java代码中使⽤Jedis客户端调⽤Reids的incr命令获得⼀个全局的id

引⼊jedis客户端jar

<dependency> 
			<groupId>redis.clients</groupId> 
			<artifactId>jedis</artifactId> <version>2.9.0</version>
	</dependency>

Java代码例子（此处我们就是连接单节点，也不使⽤连接池）

public class RedisGenerator {
    public static void main(String[] args) {
    	//获得了Redis的客户端
        Jedis jedis = new Jedis("111.229.248.243",6379);
        // 如果id不存在，那么存入Redis的数据是 <id,0>，是一个map类型数据
        Long id = jedis.incr("id");
        System.out.println(id);
    }
}

馒头太帅了

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Cluster模式潜在问题学习笔记---分布式ID问题和解决⽅案

Cluster模式潜在问题学习笔记—分布式ID解决⽅案1.为什么需要分布式ID(分布式集群环境下的全局唯⼀ID)因为当单表A数据量过多，于是就将单表A拆分成A1表，A2表，A3表，并且表的结构是一样的，但是拆出来的三个表数据的主键id是不能一样的，所以就需要分布式集群环境下的全局唯⼀ID2. 分布式ID解决⽅案：生成UUIDUUID是指Universally Unique Identifier，翻译为中⽂是通⽤唯⼀识别码，产⽣重复 UUID 并造成错误的情况⾮常低，是故⼤可不必考虑此问题。
复制链接

扫一扫