ef设置非自增长id_分布式系统ID生成

最新推荐文章于 2023-07-14 15:08:52 发布

weixin_39613561

最新推荐文章于 2023-07-14 15:08:52 发布

阅读量136

点赞数

文章标签： ef设置非自增长id

本文链接：https://blog.csdn.net/weixin_39613561/article/details/112249561

版权

1. UUID

UUID 是指Universally Unique Identifier，翻译为中文是通用唯一识别码，UUID 的目的是让分布式系统中的所有元素都能有唯一的识别信息。形式为 8-4-4-4-12，总共有 36个字符。用起来非常简单

import java.util.UUID;
public static void main(String[] args) {
		String uuid = UUID.randomUUID().toString().replaceAll("-","");
		System.out.println(uuid);
}

输出结果 99a7d0925b294a53b2f4db9d5a3fb798，但UUID却并不适用于实际的业务需求。订单号用UUID这样的字符串没有丝毫的意义，看不出和订单相关的有用信息；而对于数据库来说用作业务主键ID，它不仅是太长还是字符串，存储性能差查询也很耗时，所以不推荐用作分布式ID。

2. 基于数据库自增ID

基于数据库的auto_increment自增ID完全可以充当分布式ID，具体实现：需要一个单独的MySQL实例用来生成ID，建表结构如下：

CREATE DATABASE `SoWhat_ID`;
CREATE TABLE SoWhat_ID.SEQUENCE_ID (
    `id` bigint(20) unsigned NOT NULL auto_increment, 
    `value` char(10) NOT NULL default '',
    `update_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,
    PRIMARY KEY (id),
) ENGINE=MyISAM;
insert into SEQUENCE_ID(value) VALUES ('values');

当我们需要一个ID的时候，向表中插入一条记录返回主键ID，但这种方式有一个比较致命的缺点，访问量激增时MySQL本身就是系统的瓶颈，用它来实现分布式服务风险比较大，不推荐！

3. 基于数据库集群模式

前边说了单点数据库方式不可取，那对上边的方式做一些高可用优化，换成主从模式集群。害怕一个主节点挂掉没法用，那就做双主模式集群，也就是两个Mysql实例都能单独的生产自增ID。那这样还会有个问题，两个MySQL实例的自增ID都从1开始，会生成重复的ID怎么办？解决方案：设置起始值和自增步长

MySQL_1 配置：

set @@auto_increment_offset = 1;     -- 起始值
set @@auto_increment_increment = 2;  -- 步长

MySQL_2 配置：

set @@auto_increment_offset = 2;     -- 起始值
set @@auto_increment_increment = 2;  -- 步长

这样两个MySQL实例的自增ID分别就是：

1、3、5、7、9 
2、4、6、8、10

但是如果两个还是无法满足咋办呢？增加第三台MySQL实例需要人工修改一、二两台MySQL实例的起始值和步长，把第三台机器的ID起始生成位置设定在比现有最大自增ID的位置远一些，但必须在一、二两台MySQL实例ID还没有增长到第三台MySQL实例的起始ID值的时候，否则自增ID就要出现重复了，必要时可能还需要停机修改。

4. 基于Redis模式

Redis 也同样可以实现，原理就是Redis 是单线程的，因此我们可以利用redis的incr命令实现ID的原子性自增。

127.0.0.1:6379> set seq_id 1     // 初始化自增ID为1
OK
127.0.0.1:6379> incr seq_id      // 增加1，并返回递增后的数值
(integer) 2

用redis实现需要注意一点，要考虑到redis持久化的问题。redis有两种持久化方式RDB和AOF。

5. 基于雪花算法(Snowflake)模式

SnowFlake 算法，是 Twitter 开源的分布式 id 生成算法。其核心思想就是：使用一个 64 bit 的 long 型的数字作为全局唯一 id。在分布式系统中的应用十分广泛，且ID 引入了时间戳，为什么叫雪花算法呢？私以为众所周知世界上没有一对相同的雪花。雪花算法基本上保持自增的，后面的代码中有详细的注解。
这 64 个 bit 中，其中 1 个 bit 是不用的，然后用其中的 41 bit 作为毫秒数，用 10 bit 作为工作机器 id，12 bit 作为序列号。举例如上图：

第一个部分是 1 个 bit：0，
这个是无意义的。因为二进制里第一个 bit 位如果是 1，那么都是负数，但是我们生成的 id 都是正数，所以第一个 bit 统一都是 0。
第二个部分是 41 个 bit：表示的是时间戳。单位是毫秒。
41 bit 可以表示的数字多达 2^41 - 1，也就是可以标识 2 ^ 41 - 1 个毫秒值，换算成年就是表示 69 年的时间。
第三个部分是 5 个 bit：表示的是机房 id
5 个 bit 代表机器 id。意思就是最多代表 2 ^ 5 个机房(32 个机房)
第四个部分是 5 个 bit：表示的是机器 id。每个机房里可以代表 2 ^ 5 个机器(32 台机器)，也可以根据自己公司的实际情况确定。
第五个部分是 12 个 bit：表示的序号，就是某个机房某台机器上这一毫秒内同时生成的 id 的序号。
12 bit 可以代表的最大正整数是 2 ^ 12 - 1 = 4096，也就是说可以用这个 12 bit 代表的数字来区分同一个毫秒内的 4096 个不同的 id。

总结：
简单来说，你的某个服务假设要生成一个全局唯一 id，那么就可以发送一个请求给部署了 SnowFlake 算法的系统，由这个 SnowFlake 算法系统来生成唯一 id。

这个 SnowFlake 算法系统首先肯定是知道自己所在的机房和机器的，比如机房 id = 17，机器 id = 12。

接着 SnowFlake 算法系统接收到这个请求之后，首先就会用二进制位运算的方式生成一个 64 bit 的 long 型 id，64 个 bit 中的第一个 bit 是无意义的。

接着 41 个 bit，就可以用当前时间戳(单位到毫秒)，然后接着 5 个 bit 设置上这个机房 id，还有 5 个 bit 设置上机器 id。

最后再判断一下，当前这台机房的这台机器上这一毫秒内，这是第几个请求，给这次生成 id 的请求累加一个序号，作为最后的 12 个 bit。最终一个 64 个 bit 的 id 就出来了，类似于：
这个算法可以保证一个机房的一台机器在同一毫秒内，生成了一个唯一的 id。可能一个毫秒内会生成多个 id，但是有最后 12 个 bit 的序号来区分开来。

总结：就是用一个 64 bit 的数字中各个 bit 位来设置不同的标志位，区分每一个 id。

SnowFlake 算法的实现代码如下：

/**
 * 雪花算法相对来说如果思绪捋顺了实现起来比较简单，前提熟悉位运算。
 */
public class SnowFlake
{
/**
	 * 开始时间截 (2015-01-01)
	 */
private final long twepoch = 1420041600000L;

/**
	 * 机器id所占的位数
	 */
private final long workerIdBits = 5L;

/**
	 * 数据标识id所占的位数
	 */
private final long dataCenterIdBits = 5L;

/**
	 * 支持的最大机器id，结果是31 (这个移位算法可以很快的计算出几位二进制数所能表示的最大十进制数)
	 */
private final long maxWorkerId = ~(-1L << workerIdBits);

/**
	 * 支持的最大机房标识id，结果是31
	 */
private final long maxDataCenterId = ~(-1L << dataCenterIdBits);

/**
	 * 序列在id中占的位数
	 */
private final long sequenceBits = 12L;

/**
	 * 机器ID向左移12位
	 */
private final long workerIdShift = sequenceBits;

/**
	 * 机房标识id向左移17位(12+5)
	 */
private final long dataCenterIdShift = sequenceBits + workerIdBits;

/**
	 * 时间截向左移22位(5+5+12)
	 */
private final long timestampLeftShift = sequenceBits + workerIdBits + dataCenterIdBits;

/**
	 * 生成序列的掩码，这里为4095 (0b111111111111=0xfff=4095)
	 */
private final long sequenceMask = ~(-1L << sequenceBits);

/**
	 * 工作机器ID(0~31)
	 */
private volatile long workerId;

/**
	 * 机房中心ID(0~31)
	 */
private volatile long dataCenterId;

/**
	 * 毫秒内序列(0~4095)
	 */
private volatile long sequence = 0L;

/**
	 * 上次生成ID的时间截
	 */
private volatile long lastTimestamp = -1L;

//==============================Constructors=====================================

/**
	 * 构造函数
	 *
	 * @param workerId     工作ID (0~31)
	 * @param dataCenterId 机房中心ID (0~31)
	 */

public SnowFlake(long workerId, long dataCenterId)
{
if (workerId > maxWorkerId || workerId < 0)
{
throw new IllegalArgumentException(String.format("worker Id can't be greater than %d or less than 0", maxWorkerId));
}
if (dataCenterId > maxDataCenterId || dataCenterId < 0)
{
throw new IllegalArgumentException(String.format("dataCenter Id can't be greater than %d or less than 0", maxDataCenterId));
}
this.workerId = workerId;
this.dataCenterId = dataCenterId;
}

// ==============================Methods==========================================

/**
	 * 获得下一个ID (该方法是线程安全的)
	 * 如果一个线程反复获取Synchronized锁，那么synchronized锁将变成偏向锁。
	 *
	 * @return SnowflakeId
	 */
public synchronized long nextId() throws RuntimeException
{
long timestamp = timeGen();

//如果当前时间小于上一次ID生成的时间戳，说明系统时钟回退过这个时候应当抛出异常
if (timestamp < lastTimestamp)
{
throw new RuntimeException((String.format("Clock moved backwards.  Refusing to generate id for %d milliseconds", lastTimestamp - timestamp)));

}

//如果是毫秒级别内是同一时间生成的，则进行毫秒内序列生成
if (lastTimestamp == timestamp)
{
			sequence = (sequence + 1) & sequenceMask;
//毫秒内序列溢出，一毫秒内超过了4095个
if (sequence == 0)
{
//阻塞到下一个毫秒,获得新的时间戳
				timestamp = tilNextMillis(lastTimestamp);
}
}
else
{
//时间戳改变，毫秒内序列重置
			sequence = 0L;
}

//上次生成ID的时间截
		lastTimestamp = timestamp;

//移位并通过或运算拼到一起组成64位的ID
return ((timestamp - twepoch) << timestampLeftShift)
| (dataCenterId << dataCenterIdShift)
| (workerId << workerIdShift)
| sequence;
}

/**
	 * 阻塞到下一个毫秒，直到获得新的时间戳
	 * @param lastTimestamp 上次生成ID的时间截
	 * @return 当前时间戳
	 */
private long tilNextMillis(long lastTimestamp)
{
long timestamp = timeGen();
while (timestamp <= lastTimestamp)
{
			timestamp = timeGen();
}
return timestamp;
}

/**
	 * 返回以毫秒为单位的当前时间
	 * @return 当前时间(毫秒)
	 */
private long timeGen()
{
return System.currentTimeMillis();
}
}