雪花算法原理分析

艾尔文大叔

已于 2024-04-21 18:30:12 修改

阅读量1.3k

点赞数 46

文章标签：算法

于 2024-04-21 08:47:14 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_59877551/article/details/138021800

版权

为什么需要分布式ID？分布式ID的可选方案，优缺点？

参考资料： Leaf——美团点评分布式ID生成系统 - 美团技术团队 (meituan.com)

基础数据类型：

int类型最大值10亿级别（数量级，明显不够用）

float和double，存在不精准运算，有效位数并不大，占用字节最大同long

综合考量：long类型数据规很大，足够应用在ID策略上了

负数如何存储

位运算：&。如果两个对应的二进制位上的数都是1，结果是1，其他都是0

按位或：|。如果两个对应的二进制位上的数都是0，结果是0，其他都是1

按位异或：^。如果两个对应的二进制位上的数字相同，则运算结果为0，其他都是1

左移：<<。把二进制数据在内存空间中向左边移动。左移n相当于乘以2的n次方，但要注意两

点：1-左移带有符号位的，说明每个数据类型左移都有位数限制；2-左移后原来的值不变，移位

后是一个新的值

补码：该数的原码除符号位外各位取反，然后在最后一位加1

-1L去除符号位原码：

取反：

加1：

原理分析

前置条件：单机，机器中心：31机器号吗：31

workID：可认为是机器特征号码，一般由两部分组成：数据中心+机器号，各占用5位。也就是最

大值2^5*2^5=2^10=1024个值(0-1023)

单机情况下，如果不考虑时钟回拨，上图中，workID对于单机固定，12位序列化的变化范围为：

2^12=4096个值（0-4095）

这么分析，单机该种算法，每一毫秒可产生4096个可用不重复的序列号

1s内4096*1000=4096000个。足够很多场景下使用了。

时间部分：

69年都不会重复，既然只能使用69年，我们系统中的时间，是从1970年开始的，所以设计上，设

置一个起始时间，也就是项目开始的时间，目的为了使用更久的时间

代码：

publicsynchronized long nextId (){

long timestamp = timeGen ();

if ( timestamp < lastTimestamp ){

System . err . printf ( "clockismovingbackwards.Rejectingrequestsuntil%d." ,

lastTimestamp );

thrownewRuntimeException ( String .format ( "Clockmovedbackwards.Refusingtogenerate

idfor%dmilliseconds" ,

lastTimestamp - timestamp ));

if ( lastTimestamp == timestamp ){

sequence = ( sequence + 1 ) & sequenceMask ;

if ( sequence == 0 ){

timestamp = tilNextMillis ( lastTimestamp );

}

} else {

sequence = 0 ;

}

lastTimestamp = timestamp ;

return (( timestamp - twepoch ) << timestampLeftShift ) |

( datacenterId << datacenterIdShift ) |

( workerId << workerIdShift ) | sequence ;

}

if (timestamp < lastTimestamp) { //lastTimestamp，上次生成时间，本次生成时间

timestamp ，如果小于，说明时钟回拨

if (lastTimestamp == timestamp) {//说明两次生成ID的时间戳在同一毫秒内，否则，每一s从0

开始生成最后的序列号。

最终如何组成结果：

return ((timestamp - twepoch) << timestampLeftShift) |

(datacenterId << datacenterIdShift) |

(workerId << workerIdShift) |

sequence;

每一个号段向左移位置，在按位或，如下图：

这里解释了最终结果的构成，非常巧妙，综合了性能，变化点，生成了非常完美，不容易重合的一

个long数字，那么问题只剩下，相同时间如何拿到后边的12位序列了

if(lastTimestamp==timestamp){

//如果等走到这里：说明来给你个问题，第一：肯定生成过一次序列，那么sequence一定不可能从0开始

//sequenceMark=-1L^(-1L<<sequenceBits)经过前面基础知识，可知

//sequenceMask=0000000000000000000000000000000000000000000000000000111111111111

//如果sequence=0，说明：

//sequence+1=0000000000000000000000000000000000000000000000000001000000000000

//sequence= 0000000000000000000000000000000000000000000000000000111111111111

//说明此时sequence=4095，及已经增长到最大值

//初始进入此条件的时候，sequence=

0000000000000000000000000000000000000000000000000000000000000000

//经过sequence=(sequence+1)&sequenceMask;

//sequence=0000000000000000000000000000000000000000000000000000000000000001

sequence=(sequence+1)&sequenceMask;

//如果此处等于零，相当于4095之后，在同一秒内再次需要生成序列，此时根据设计12位，已经不能在生成

了，所以，相当于系统调整了下时间，把当前时间修改到下一秒钟，参考tilNextMillis(lastTimestamp)，不难理解了。

if(sequence==0){timestamp=tilNextMillis(lastTimestamp);

}

}

存在的问题：

问题1：

雪花算法的设计等价于单台机器

不变（符号位置）+变化（时间戳）+不变（最大31）+不变（最大31）+变化（0-+4096）

多台机器

不变（符号位置）(不变)+变化（时间戳）(多机会重复)+（不变（最大31）()+不变（最大31））

(组合不变)+变化（0-+4096）(可能重复)

等价于：

不变+不变+（变化）（自由组合）+不变

自由组合：可以分成2段，也可以是云主机一段，每个IP不通即可

问题2：时间回拨

这种设计，严重依赖服务器的时间，但是时间，不仅是哲学家的难题，也是计算机领域的一大难

题，至少linux上，存在时间同步等产生的时间跳跃问题，在分布式环境中，如果事件发生回拨，

则很大概率产生重复的ID。

艾尔文大叔

关注

46
点赞
踩
30

收藏

觉得还不错? 一键收藏
1
评论
雪花算法原理分析

了，所以，相当于系统调整了下时间，把当前时间修改到下一秒钟，参考tilNextMillis(lastTimestamp)，不难理解了。69年都不会重复，既然只能使用69年，我们系统中的时间，是从1970年开始的，所以设计上，设。题，至少linux上，存在时间同步等产生的时间跳跃问题，在分布式环境中，如果事件发生回拨，这里解释了最终结果的构成，非常巧妙，综合了性能，变化点，生成了非常完美，不容易重合的一。这种设计，严重依赖服务器的时间，但是时间，不仅是哲学家的难题，也是计算机领域的一大难。
复制链接

扫一扫

艾尔文大叔 CSDN认证博客专家 CSDN认证企业博客

码龄3年

41: 原创

18万+: 周排名

3万+: 总排名

2万+: 访问

: 等级

1123: 积分

566: 粉丝

709: 获赞

10: 评论

537: 收藏

私信

关注

热门文章

分类专栏

JAVA 9篇
网络协议 2篇
并发编程 6篇
Redis 4篇
微服务 2篇
JVM 4篇
数据库 3篇
MQ消息队列 2篇
垃圾回收 1篇

最新评论

常用消息队列中间件MQ对比分析
普通网友: 学到了，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
常用消息队列中间件MQ对比分析
2301_79772893: 引领技术潮流，是不可多得的好文，十分值得借鉴和参考。期待博主未来能够持续分享更多好文【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
RocketMQ的物理架构
普通网友: 这篇文章是优质之作，内容充实，结构明晰，语言流畅且通俗易懂，适合广大读者阅读。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Redis的内存淘汰机制&布隆过滤器流程
weixin_39760101: ₍˄·͈༝·͈˄*₎◞ ̑̑
Java对象的内存模型
CSDN-Ada助手: 恭喜您写了第7篇博客，探讨了Java对象的内存模型，内容相当丰富和深刻。建议您在未来的创作中，可以尝试深入探讨Java中其他重要概念，比如多线程编程或者Java虚拟机等方面的知识，相信会有更多精彩的文章呈现给读者。期待您更多的作品！

大家在看

最新文章

2024

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。