“ 该系列是对美团Leaf、滴滴TinyId、百度UidGenerator的源码分析和思考”
大家好,我是面条哥。
01
—
什么是分布式ID
在分布式系统中,ID的生成分布在不同的服务器并保证全局唯一,我们把这种ID叫做分布式ID。
02
—
为什么需要分布式ID
摘抄美团技术团队对分布式ID的要求。
-
全局唯一性:不能出现重复的ID号,既然是唯一标识,这是最基本的要求。举个例子:MySQL在分库分表的时候,很多时候都会使用自增长id作为主键,由于是不同的表组成了一个大而全的表数据,所以生成的id时候,如果不做控制,不同的表就会出现相同的主键,对于全局而言就会产生冲突。
-
趋势递增:在MySQL InnoDB引擎中使用的是聚集索引,由于多数RDBMS使用B-tree的数据结构来存储索引数据,在主键的选择上面我们应该尽量使用有序的主键保证写入性能。
-
单调递增:保证下一个ID一定大于上一个ID,例如事务版本号、IM增量消息、排序等特殊需求。
-
信息安全:如果ID是连续的,恶意用户的扒取工作就非常容易做了,直接按照顺序下载指定URL即可;如果是订单号就更危险了,可以直接知道我们一天的单量。所以在一些应用场景下,会需要ID无规则、不规则。
03
—
分布式ID的解决方案
1、一个实际营销项目的ID生成案例
需求:给一个租户或者渠道生成一个全局唯一的AppKey,并发小,有规律,易记,实现功能要求快。
【技术设计方案】
方案解释:(当年-2000) + (当前日,凑3位不够补0) + (当前小时,凑2位不够补0) + (从1开始五位数不够补0)。左侧是自定义的规则(方案设计上有bug,但是不影响举例说明),右侧是利用redis的原子操作incr保证并发下唯一并自增长,可以看出来210201400001是2021年某月的20号14点生成的第一个key,这种方式比较简单,只需要利用redis的机制即可,如果项目属于传统行业、使用率低、并发量小,这个功能就可以满足需求了。
2、百度UidGenerator
在了解百度的分布式id生成器之前,需要先了解一下雪花算法。
【雪花算法原理图】
-
41-bit的时间可以表示(1L<<41)/(1000L*3600*2