Twitter分布式ID生成算法解密

最新推荐文章于 2020-10-15 00:56:02 发布

weixin_34381666

最新推荐文章于 2020-10-15 00:56:02 发布

阅读量121

点赞数

文章标签： python

原文链接：https://my.oschina.net/u/3498817/blog/3035986

版权

2019独角兽企业重金招聘Python工程师标准>>>

snowflake算法，是twitter开源的分布式id生成算法!

核心思想

使用一个64 bit的long型的数字作为全局唯一id，这64个bit中，其中1个bit是不用的，然后用其中的41 bit作为毫秒数，用10 bit作为工作机器id，12 bit作为序列号

上面第一个部分，是1个bit：0，这个是无意义的

上面第二个部分是41个bit：表示的是时间戳

上面第三个部分是5个bit：表示的是机房id，10001

上面第四个部分是5个bit：表示的是机器id，1 1001

上面第五个部分是12个bit：表示的序号，就是某个机房某台机器上这一毫秒内同时生成的id的序号，0000 00000000
1 bit 是不用的，为啥呢？因为二进制里第一个bit为如果是1，那么都是负数，但是我们生成的id都是正数，所以第一个bit统一都是0
41 bit：表示的是时间戳，单位是毫秒。41 bit可以表示的数字多达2^41 - 1，也就是可以标识2 ^ 41 - 1个毫秒值，换算成年就是表示69年的时间
10 bit：记录工作机器id，代表的是这个服务最多可以部署在2^10台机器上，也就是1024台机器
12 bit：这个是用来记录同一个毫秒内产生的不同id.12 bit可以代表的最大正整数是2 ^ 12 - 1 = 4096，也就是说可以用这个12bit代表的数字来区分同一个毫秒内的4096个不同的id
简单来说你的某个服务假设要生成一个全局唯一id，那么就可以发送一个请求给部署了snowflake算法的系统，由这个snowflake算法系统来生成唯一id。这个snowflake算法系统首先肯定是知道自己所在的机房和机器的，比如机房id = 17，机器id = 12。接着snowflake算法系统接收到这个请求之后，首先就会用二进制位运算的方式生成一个64 bit的long型id，64个bit中的第一个bit是无意义的。
接着41个bit，就可以用当前时间戳（单位到毫秒），然后接着5个bit设置上这个机房id，还有5个bit设置上机器id。
最后再判断一下，当前这台机房的这台机器上这一毫秒内，这是第几个请求，给这次生成id的请求累加一个序号，作为最后的12个bit
一个机房的一台机器上，在同一毫秒内，生成了一个唯一的id。可能一个毫秒内会生成多个id，但是有最后12个bit的序号来区分开来

转载于:https://my.oschina.net/u/3498817/blog/3035986

weixin_34381666

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Twitter分布式ID生成算法解密

2019独角兽企业重金招聘Python工程师标准>>> ...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。