雪花算法(Snowflake)是一种广泛使用的分布式系统中生成唯一 ID 的算法。它在 Twitter 公司内部首次实现,用来作为 Twitter 分布式系统中每条消息的唯一ID。该算法生成的 ID 为 64 位二进制数字,由以下 4 个部分组成:
- 时间戳戳:41 位,精确到毫秒级别,可以使用 69 年。
- 数据中心标识:5 位,表示数据中心 ID。
- 机器标识:5 位,表示机器 ID。
- 序列号:12 位,表示每个节点在同一毫秒内生成的序列号。如果节点在同一毫秒内生成了多个 ID,序列号会递增直至下一毫秒。
以下是 Java 代码示例,实现了基于雪花算法的唯一 ID 生成器:
public class IdGenerator {
private final static long START_TIME = 1288834974657L;
private final static long DATA_CENTER_ID_BITS = 5L;
private final static long WORKER_ID_BITS = 5L;
private final static long SEQUENCE_BITS = 12L;
private final static long MAX_DATA_CENTER_ID = ~(-1L << DATA_CENTER_ID_BITS);
private final static long MAX_WORKER_ID = ~(-1L << WORKER_ID_BITS);
private final static long MAX_SEQUENCE = ~(-1L << SEQUENCE_BITS);
private final static long DATA_CENTER_ID_SHIFT = SEQUENCE_BITS + WORKER_ID_BITS;
private final static long WORKER_ID_SHIFT = SEQUENCE_BITS;
private final static long TIMESTAMP_LEFT_SHIFT = SEQUENCE_BITS + WORKER_ID_BITS + DATA_CENTER_ID_BITS;
private long dataCenterId;
private long workerId;
private long sequence = 0L;
private long lastTimestamp = -1L;
public IdGenerator(long dataCenterId, long workerId) {
if (dataCenterId > MAX_DATA_CENTER_ID || dataCenterId < 0) {
throw new IllegalArgumentException(String.format("数据中心 ID 不能大于 %d 或小于 0", MAX_DATA_CENTER_ID));
}
if (workerId > MAX_WORKER_ID || workerId < 0) {
throw new IllegalArgumentException(String.format("机器标识不能大于 %d 或小于 0", MAX_WORKER_ID));
}
this.dataCenterId = dataCenterId;
this.workerId = workerId;
}
public synchronized long nextId() {
long timestamp = timeGen();
if (timestamp < lastTimestamp) {
throw new RuntimeException("时间戳异常");
}
if (lastTimestamp == timestamp) {
sequence = (sequence + 1) & MAX_SEQUENCE;
if (sequence == 0) {
timestamp = tilNextMillis(lastTimestamp);
}
} else {
sequence = 0L;
}
lastTimestamp = timestamp;
return (timestamp - START_TIME) << TIMESTAMP_LEFT_SHIFT |
dataCenterId << DATA_CENTER_ID_SHIFT |
workerId << WORKER_ID_SHIFT |
sequence;
}
private long tilNextMillis(long lastTimestamp) {
long timestamp = timeGen();
while (timestamp <= lastTimestamp) {
timestamp = timeGen();
}
return timestamp;
}
private long timeGen() {
return System.currentTimeMillis();
}
}
在上面的实现中,我们使用了 synchronized 关键字来保证线程安全。同时也实现了时间戳回拨(clock drift)时的异常处理。由于时间戳只有 41 位,所以在一个节点上产生的 ID 数量是有限的。最大值是每秒 2^12=4096 个。若要提高性能,可以添加分布式锁机制,更换硬件时机器 ID 应保证不变,同时使用数据中心编号的方法避免不同数据中心之间节点重复。
可以通过如下方法使用这个 ID 生成器:
IdGenerator idGenerator = new IdGenerator(1L, 1L);
long nextId = idGenerator.nextId();