分布式Id-雪花算法

最新推荐文章于 2024-03-20 23:09:27 发布

飞行模式、

最新推荐文章于 2024-03-20 23:09:27 发布

阅读量335

点赞数 8

分类专栏： java后端文章标签：分布式 java

本文链接：https://blog.csdn.net/m0_62844645/article/details/135851872

版权

java后端专栏收录该内容

5 篇文章 0 订阅

订阅专栏

雪花算法利用64位位长生成唯一ID，但时钟回拨可能导致ID重复。文章探讨了这个问题的原因，如网络时间调整和负闰秒，以及提供了一种解决方案，包括在高并发场景下的异常处理策略。

摘要由CSDN通过智能技术生成

雪花算法

在这里插入图片描述

雪花算法的原理就是生成一个的 64 位比特位的 long 类型的唯一 id。
最高 1 位固定值 0，因为生成的 id 是正整数，如果是 1 就是负数了。
接下来 41 位存储毫秒级时间戳，2^41/(1000606024365)=69，大概可以使用 69 年。
再接下 10 位存储机器码，包括 5 位 datacenterId 和 5 位 workerId。最多可以部署 2^10=1024 台机器。最后 12 位存储序列号。同一毫秒时间戳时，通过这个递增的序列号来区分。即对于同一台机器而言，同一毫秒时间戳下，可以生成 2^12=4096 个不重复 id。

问题：时钟回拨

简单说就是时间被调整回到了之前的时间，由于雪花算法重度依赖机器的当前时间，所以一旦发生时间回拨，将有可能导致生成的 ID 可能与此前已经生成的某个 ID 重复（前提是刚好在同一毫秒生成 ID 时序列号也刚好一致），这就是雪花算法最经常讨论的问题——时间回拨

引发此问题原因：

网络时间校准
人工设置（人工回拨服务器时间）
出现负闰秒

解决方案：

直接抛异常

在雪花算法原本的实现中，针对这种问题，算法本身只是返回错误，由应用另行决定处理逻辑，如果是在一个并发不高或者请求量不大的业务系统中，错误等待或者重试的策略问题不大，但是如果是在一个高并发的系统中，这种策略显得过于粗暴
延迟等待

将当前线程阻塞3ms，之后再获取时间，看时间是否比上一次请求的时间大，如果大了，说明恢复正常了，则不用管如果还小,说明真出问题了，则抛出异常，缺点仍然如3.1所描述
设置标志位

如上图，将原本10位的机器码拆分成3位时钟序列及7位机器码
发生时间回拨的时候，时间已经发生了变化，那么这时将时钟序列新增1位，重新定义整个雪花Id
为了避免实例重启引起时间序列丢失，因此时钟序列最好通过DB/缓存等方式存储起来

飞行模式、

关注

8
点赞
踩
6

收藏

觉得还不错? 一键收藏
打赏
0
评论
分布式Id-雪花算法

简单说就是时间被调整回到了之前的时间，由于雪花算法重度依赖机器的当前时间，所以一旦发生时间回拨，将有可能导致生成的 ID 可能与此前已经生成的某个 ID 重复（前提是刚好在同一毫秒生成 ID 时序列号也刚好一致），这就是雪花算法最经常讨论的问题——时间回拨。在雪花算法原本的实现中，针对这种问题，算法本身只是返回错误，由应用另行决定处理逻辑，如果是在一个并发不高或者请求量不大的业务系统中，错误等待或者重试的策略问题不大，但是如果是在一个高并发的系统中，这种策略显得过于粗暴。同一毫秒时间戳时，通过这个。
复制链接

扫一扫