分布式唯一ID方案之雪花算法Snowflake

最新推荐文章于 2024-08-03 14:41:33 发布

Java技术那些事儿

最新推荐文章于 2024-08-03 14:41:33 发布

阅读量784

点赞数

文章标签： java servlet 开发语言

本文链接：https://blog.csdn.net/LBWNB_Java/article/details/126435995

版权

对于数据量庞大且需要考虑有序性时，那么可以使用雪花算法，当然既然要使用高性能工具，肯定是需要付出代价的，代价就是需要维护多个系统组件来保证高效生成有序的唯一ID。下面从概念到实践一一介绍：

分布式唯一ID

使用RocketMQ时，需要使用到分布式唯一ID
消息可能会发生重复，所以要在消费端做幂等性，为了达到业务的幂等性，生产者必须要有一个唯一ID。

需要满足以下条件:
- 同一业务场景要全局唯一
- 该ID必须是在消息的发送方进行生成发送到MQ
- 消费端根据该ID进行判断是否重复,确保幂等性
在哪里产生以及消费端进行判断做幂等性与该ID无关，此ID需要保证的特性:
- 局部甚至全局唯一
- 趋势递增

Snowflake算法

Snowflake是Twitter开源的分布式ID生成算法, 结果是一个Long型的ID,核心思想是:
- 使用1位作为符号位,确定为0, 表示正
- 使用41位作为毫秒数
- 使用10位作为机器的ID : 高5位是数据中心ID, 低5位是机器ID
- 使用12位作为毫秒内的序列号，意味着每个节点每秒可以产生4096(212)个ID；该算法通过二进制的操作进行实现,单机每秒内理论上最多可以生成1000*(2^12)，即409.6万个ID。

SnowflakeIdWorker

Snowflake算法Java实现SnowflakeIdWorker:

/**
 * Twitter_Snowflake<br>
 * SnowFlake的结构如下(每部分用-分开):<br>
 * 0 - 0000000000 0000000000 0000000000 0000000000 0 - 00000 - 00000 - 000000000000 <br>
 * 1位标识，由于long基本类型在Java中是带符号的，最高位是符号位，正数是0，负数是1，所以id一般是正数，最高位是0<br>
 * 41位时间截(毫秒级)，注意，41位时间截不是存储当前时间的时间截，而是存储时间截的差值（当前时间截 - 开始时间截)
 * 得到的值），这里的的开始时间截，一般是我们的id生成器开始使用的时间，由我们程序来指定的（如下下面程序IdWorker类的startTime属性）。41位的时间截，可以使用69年，年T = (1L << 41) / (