每周一总结（4）分布式ID 学习笔记

最新推荐文章于 2022-01-18 15:38:36 发布

沙漏dan

最新推荐文章于 2022-01-18 15:38:36 发布

阅读量509

点赞数

分类专栏：每周一总结分布式

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sxllllwd/article/details/108687450

版权

每周一总结同时被 2 个专栏收录

3 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

在分布式系统，有些数据会存在全局唯一的需求，生成全局唯一的分布式ID也很重要。

分布式ID需要具备的特点

全局唯一：最基本的要素

趋势递增：分布式ID用来标识数据的唯一性，往往会被用作主键或者是唯一索引。常用的MySQL InnoDB，使用的索引往往是BTree索引，自增的数据在插入时会有较高的效率。

信息安全：避免恶意用户直接根据自增ID获取数据信息

几种分布式ID的实现方式

UUID

UUID(Universally Unique Identifier)的标准型式包含32个16进制数字，以连字号分为五段，形式为8-4-4-4-12的36个字符。UUID是基于当前时间、计数器和硬件标识（比如MAC地址）生成的

优点：

本地生成，不需要远程调用

缺点：

生成结果较长，不适合作为索引

无序的UUID作为主键索引也会严重影响数据插入的效率

基于MAC地址生成的UUID可能会造成MAC地址泄漏

雪花算法

64bit

第一个bit用于表示正数还是负数。作为ID的情况下，这个位置固定为0。

41bit用于表示毫秒级时间戳，可以使用69年。

10bit workerId可以用于表示1024台机器。

12bit用于作为自增序列号

雪花算法理论上的QPS可以到达4096000

优点：

时间在高位，序列号在低位。趋势递增

生成的ID为long类型

不需要依赖数据库等

缺点：

强依赖时钟，时钟回拨会导致发号重复

数据库生成

利用数据库自增ID特性生成ID，每次写入之后获取last insert id。

优点：

实现成本低

有序自增

缺点：

强依赖数据库，且ID生成性能受限于数据库写入的性能

Flickr 方案

每台机器设置不同的初始值以及指定步长，步长=部署的机器数量。比如2台机器的情况，第一台机器生成的ID是1，3，5，7，第二台生成的是2，4，6，8。

优点：

实现简单

缺点：

步长固定，需要扩容的时候很难处理

每次生成ID都需要读写数据库

号段方法

批量获取ID，缓存在本地，缓存数据用完之后才会再去获取下一批ID。

优点：

数据库的读写频率从原本的每次获取ID都需要对数据库进行读写，频率降为之前的1/(批量获取ID的size)

ID号码趋势递增

对号段有缓存，即使数据库暂时不可用，ID仍然可以坚持到缓存的号段分配完成

缺点：

ID号码不够随机，可能会泄露发号的数量

号段用完之后还是可能会受到DB读写性能的影响

可以从上面的几种方式，学习到的基本思路是：根据实例唯一标识+时间戳+自增序列号作为分布式ID生成的规则。

继续学习和阅读

Leaf——美团点评分布式ID生成系统

微信序列号生成器架构设计及演变

百度UidGenerator

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。