雪花算法id

为啥昵称重复呐

已于 2024-01-18 10:46:33 修改

阅读量996

点赞数 14

分类专栏： SnowflakeId 文章标签： java

于 2024-01-18 10:19:03 首次发布

本文链接：https://blog.csdn.net/m0_74021233/article/details/135667403

版权

本文介绍了Snowflake算法，Twitter开发的一种用于生成分布式系统中全局唯一标识的方法，详细阐述了其ID结构、优缺点以及在Java中的实现示例，包括SpringBoot集成和时钟回拨处理。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1. 基本介绍

Snowflake(雪花算法)由Twitter公司开发，用于解决分布式系统中生成唯一标识的问题

说明：

雪花算法生成ID通常在Java中实现，而不是在数据库中。这是因为雪花算法的核心思想是在分布式环境中生成全局唯一的ID，而不依赖于数据库。在数据库中实现可能会引入单点故障，而不符合分布式系统的设计原则

1.1. 雪花算法id组成

 1  41                             5        5           12
+-+---------------------------------+--------+------------+
|0| timestamp(ms)                  | datacenter | machine  | sequence  |
+-+---------------------------------+--------+------------+

时间戳（41位）：

占用41位，表示生成ID的时间戳。通常使用毫秒级别的时间戳。
可表示的时间范围为：2^41毫秒，大约69年。

数据中心标识（5位）：

用于标识数据中心，通常手动配置。允许的最大值为2^5。

机器标识（5位）：

用于标识机器（节点），通常手动配置。允许的最大值为2^5。

序列号（12位）：

用于标识同一毫秒内生成的ID的序列号。如果同一毫秒内生成的ID数量超过4096（2^12），则会进行等待。
可表示的序列号范围为：0 - 4095。

1.2 优点

全局唯一性： 雪花算法生成的ID在整个分布式系统中具有全局唯一性，不同节点生成的ID不会冲突。
趋势递增： 生成的ID按照时间戳的顺序递增，有助于提高索引性能。
简单高效： 雪花算法的实现相对简单，生成ID的速度较快，不依赖于数据库或网络的通信。

1.3 缺点

时间回拨问题： 如果系统时间发生回拨，可能导致在同一时间戳内生成的ID不是严格递增的，因此在处理时间回拨问题时需要额外的逻辑。
依赖机器时钟： 雪花算法依赖于机器的时钟，如果机器时钟不同步，可能导致生成的ID不准确。
有限的容量： 由于ID的结构和位数限制，雪花算法在短时间内生成的ID数量有上限，如果系统需要生成极高频率的ID，可能需要考虑其他方案。
数据中心和机器标识分配： 数据中心和机器标识需要手动分配，这需要一些管理工作。同时，分配的位数决定了数据中心和机器的最大数量。
不适合短时间内大量生成ID： 如果在短时间内需要大量生成ID，可能会遇到序列号用尽的问题，需要等待下一个时间戳。

2. 示例

2.1 手动实现

public class SnowflakeIdGenerator {
   
	
	// 起始的时间戳，可以根据实际情况调整
	private static final long START_TIMESTAMP = 1609459200000L; // 2021-01-01 00:00:00
	
	// 每部分占用的位数
	private static final long SEQUENCE_BIT = 12; // 序列号占用的位数
	private static final long MACHINE_BIT = 5;   // 机器标识占用的位数
	private static final long DATA_CENTER_BIT = 5; // 数据中心标识占用的位数
	
	// 每部分的最大值
	private static final long MAX_SEQUENCE = ~(-

最低0.47元/天解锁文章