Java项目实践，分布式系统如何生成ID，重点介绍雪花算法

最新推荐文章于 2024-10-22 19:00:00 发布

daobuxinzi

最新推荐文章于 2024-10-22 19:00:00 发布

阅读量489

点赞数

文章标签： java 分布式

原文链接：https://zhuanlan.zhihu.com/p/363587148

版权

在分布式系统中，如何在各个不同的服务器上产生数据主键ID值?

比如，有一个订单系统被部署在了AB两个节点上(即两台服务器上)，那么如何在这两个节点上各自生成订单ID，并且保证ID值不会冲突?

通常有以下3种方法：

1、使用数据库的自增特性(或Oracle中的序列) ，不同节点直接使用相同数据库的自增ID值。

2、使用UUID算法产生ID值。

3、使用SnowFlake算法产生ID值。

由于Java提供了对UUID的支持，可以直接通过UUID.random UUID) 获取到UUID值。

本文重点介绍SnowFlake算法。SnowFlake算法被称为雪花算法，是由Twitter提出的一种生成ID的算法，该算法会生成一个64bit的整数，共可以表示263个ID值。

SnowFlake算法采用“41位时间戳+10位机器码+12位序列号”的大致思想是，当多个节需要生成多个ID值时，先判断这些节点是否是在同一时刻(精确到ms)生成的ID。

如果不是位序列号”区分ID值。可以直接根据41位时间截区分出ID值；如果是在同一时刻生成的，就再根据“10位机器码和12位序列号“来区分ID值。

具体算法代码：

//本例将10位机器码看成是“5位datacenterId+5位workerId”
public class SnowFlake {

	   private long workerId;
	    private long datacenterId;
	    //每毫秒生产的序列号之从0开始递增；
	    private long sequence = 0L;
	    /*
	        1288834974657L是1970-01-01 00:00:00到2010年11月04日01:42:54所经过的毫秒数；
	        因为现在二十一世纪的某一时刻减去1288834974657L的值，正好在2^41内。
	        因此1288834974657L实际上就是为了让时间戳正好在2^41内而凑出来的。
	        简言之，1288834974657L（即1970-01-01 00:00:00），就是在计算时间戳时用到的“起始时间”。
	     */
	    private long twepoch = 1288834974657L;

	    private long workerIdBits = 5L;
	    private long datacenterIdBits = 5L;
	    private long maxWorkerId = -1L ^ (-1L <<workerIdBits);
	    private long maxDatacenterId = -1L ^ (-1L <<datacenterIdBits);
	    private long sequenceBits = 12L;

	    private long workerIdShift = sequenceBits;
	    private long datacenterIdShift = sequenceBits + workerIdBits;
	    private long timestampLeftShift = sequenceBits + workerIdBits + datacenterIdBits;
	    private long sequenceMask = -1L ^ (-1L <<sequenceBits);

	    private long lastTimestamp = -1L;

	    public SnowFlake(long datacenterId, long workerId) {
	        if ((datacenterId >maxDatacenterId || datacenterId <0)
	                ||(workerId >maxWorkerId || workerId <0)) {
	            throw new IllegalArgumentException("datacenterId/workerId值非法");
	        }
	        this.datacenterId = datacenterId;
	        this.workerId = workerId;
	    }

	    //通过SnowFlake生成id的核心算法
	    public synchronized long nextId() {
	        //获取计算id时刻的时间戳
	        long timestamp = System.currentTimeMillis();

	        if (timestamp <lastTimestamp) {
	            throw new RuntimeException("时间戳值非法");
	        }
	        //如果此次生成id的时间戳，与上次的时间戳相同，就通过机器码和序列号区分id值（机器码已通过构造方法传入）
	        if (lastTimestamp == timestamp) {
	            /*
	                下一条语句的作用是：通过位运算保证sequence不会超出序列号所能容纳的最大值。
	                例如，本程序产生的12位sequence值依次是：1、2、3、4、...、4094、4095
	                （4095是2的12次方的最大值，也是本sequence的最大值）
	                那么此时如果再增加一个sequence值（即sequence + 1），下条语句就会
	                使sequence恢复到0。
	                即如果sequence==0，就表示sequence已满。
	             */
	            sequence = (sequence + 1) &sequenceMask;
	 //如果sequence已满，就无法再通过sequence区分id值；因此需要切换到下一个时间戳重新计算。
	            if (sequence == 0) {
	                timestamp = tilNextMillis(lastTimestamp);
	            }
	        } else {
	            //如果此次生成id的时间戳，与上次的时间戳不同，就已经可以根据时间戳区分id值
	            sequence = 0L;
	        }
	        //更新最近一次生成id的时间戳
	        lastTimestamp = timestamp;
	        /*
	            假设此刻的值是（二进制表示）：
	                41位时间戳的值是：00101011110101011101011101010101111101011
	                5位datacenterId（机器码的前5位）的值是：01101
	                5位workerId（机器码的后5位）的值是：11001
	                sequence的值是：01001
	            那么最终生成的id值，就需要：
	                1.将41位时间戳左移动22位（即移动到snowflake值中时间戳应该出现的位置）；
	                2.将5位datacenterId向左移动17位，并将5位workerId向左移动12位
	                （即移动到snowflake值中机器码应该出现的位置）；
	                3.sequence本来就在最低位，因此不需要移动。
	            以下<<和|运算，实际就是将时间戳、机器码和序列号移动到snowflake中相应的位置。
	         */
	        return ((timestamp - twepoch) <<timestampLeftShift)
	                | (datacenterId <<datacenterIdShift) | (workerId <<workerIdShift)
	                | sequence;
	    }

	    protected long tilNextMillis(long lastTimestamp) {
	        long timestamp = System.currentTimeMillis();
	        /*
	            如果当前时刻的时间戳<=上一次生成id的时间戳，就重新生成当前时间。
	            即确保当前时刻的时间戳，与上一次的时间戳不会重复。
	         */
	        while (timestamp <= lastTimestamp) {
	            timestamp = System.currentTimeMillis();
	        }
	        return timestamp;
	    }
}

测试算法代码：

public class TestSnowFlake {
	//测试1秒能够生成的id个数
		public static void generateIdsInOneSecond() {
			 SnowFlake idWorker = new SnowFlake(1, 1);
			 long start = System.currentTimeMillis();
			 int i = 0;
			 for (; System.currentTimeMillis() - start <1000; i++) {
					// idWorker.nextId();
					 System.out.println(idWorker.nextId());
			 }
			 long end = System.currentTimeMillis();
			 System.out.println("耗时："+ (end - start));
			 System.out.println("生成id个数："+ i);
		}

		public static void main(String[] args) {
			 generateIdsInOneSecond();
	}
}

测试结果图：