高并发下ID生成方案

最新推荐文章于 2024-04-06 13:12:13 发布

深夜的猫

最新推荐文章于 2024-04-06 13:12:13 发布

阅读量1.1w

点赞数 2

分类专栏：架构猫算法文章标签：全局唯一 GUID 全局时钟 ID生成

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yeshencat/article/details/72460458

版权

算法同时被 2 个专栏收录

6 篇文章 0 订阅

订阅专栏

2 篇文章 0 订阅

订阅专栏

需求
- 生成全局唯一的ID
- 趋近有序(例如：1 3 4 6 9 18)
解决方案(涉及到数据以MySql为例)
- 方案一：使用原生数据库的 auto_increment 来生成全局唯一ID
  - 优点：
    - 原生数据库简单快捷
    - 保证可靠唯一性
    - 步长有序固定
  - 缺点：
    - 不能保证高可用性，数据库常见的架构：一主多从(master+slave),本问题写居多，master库挂了就玩完了
    - 扩展性差，性能依赖master库写入的性能
  - 优化方案：
    - 新增master、避免单点写入
    - 数据水平切分，保证每个库生成的ID 不重复
    - 见下图：
    - 1库平行扩展为4个库，分摊了写入的压力
    - Mysql 这边需要自行设置auto_increment_offset 确定AUTO_INCREMENT列值的起点，也就是初始值。auto_increment_increment控制列中的值的增量值，也就是步长。
    - root@localhost[kevin]> set session auto_increment_offset=1;
    - root@localhost[kevin]> set session auto_increment_increment=4;
    - 不足之处：相对保持ID递增，不过一般项目足矣
- 方案二：单点生成ID服务,预生成id
  - 详解：数据库里记录最后一次分配的最大id，初始为max_id=1,假如第一生成 6个ID，第一步：generate-server 先获取数据库的max-id=0,第二步：然后更新 max_id=（0+6），generate-server 拿到初始max-id和本次拉取id个数生成ID,max_id < 生成ID集合 < (max_id+N)
  - 示意图：
  - 单点服务+shadow 服务保证高可用性
  - 批量生成ID大大降低了数据库压力，且能保证ID 相对递增
  - 每秒生成10W级的ID
- 方案三：本地生成 ID策略，依赖算法
  - 下面讲解snowflake算法，下面提供 PHP snowflake 的扩展
    - snowflake github
  - Twitter-Snowflake算法产生的背景相当简单，为了满足Twitter每秒上万条消息的请求，每条消息都必须分配一条唯一的id，这些id还需要一些大致的顺序（方便客户端排序），并且在分布式系统中不同机器产生的id必须不同。
  - Snowflake算法核心,把时间戳，工作机器id，序列号组合在一起。
  - 除了最高位bit标记为不可用以外，其余三组bit占位均可浮动，看具体的业务需求而定。默认情况下41bit的时间戳可以支持该算法使用到2082年，10bit的工作机器id可以支持1023台机器，序列号支持1毫秒产生4095个自增序列id。下文会具体分析。
  - Snowflake – 时间戳
    这里时间戳的细度是毫秒级，具体代码如下，建议使用64位linux系统机器，因为有vdso，gettimeofday()在用户态就可以完成操作，减少了进入内核态的损耗。
```
uint64_t generateStamp()
{
    timeval tv;
    gettimeofday(&tv, 0);
    return (uint64_t)tv.tv_sec * 1000 + (uint64_t)tv.tv_usec / 1000;
}
```
    默认情况下有41个bit可以供使用，那么一共有T（1llu << 41）毫秒供你使用分配，年份 = T / (3600 * 24 * 365 * 1000) = 69.7年。如果你只给时间戳分配39个bit使用，那么根据同样的算法最后年份 = 17.4年。
  - Snowflake – 工作机器id
    严格意义上来说这个bit段的使用可以是进程级，机器级的话你可以使用MAC地址来唯一标示工作机器，工作进程级可以使用IP+Path来区分工作进程。如果工作机器比较少，可以使用配置文件来设置这个id是一个不错的选择，如果机器过多配置文件的维护是一个灾难性的事情。
    这里的解决方案是需要一个工作id分配的进程，可以使用自己编写一个简单进程来记录分配id，或者利用Mysql auto_increment机制也可以达到效果。
  - snowflake - 工作id
    工作进程与工作id分配器只是在工作进程启动的时候交互一次，然后工作进程可以自行将分配的id数据落文件，下一次启动直接读取文件里的id使用。
    
    PS：这个工作机器id的bit段也可以进一步拆分，比如用前5个bit标记进程id，后5个bit标记线程id之类:D
  - Snowflake – 序列号
    序列号就是一系列的自增id（多线程建议使用atomic），为了处理在同一毫秒内需要给多条消息分配id，若同一毫秒把序列号用完了，则“等待至下一毫秒”。
```
uint64_t waitNextMs(uint64_t lastStamp)
{
    uint64_t cur = 0;
    do {
        cur = generateStamp();
    } while (cur <= lastStamp);
    return cur;
}
```
    总体来说，是一个很高效很方便的GUID产生算法，一个int64_t字段就可以胜任，不像现在主流128bit的GUID算法，即使无法保证严格的id序列性，但是对于特定的业务，比如用做游戏服务器端的GUID产生会很方便。另外，在多线程的环境下，序列号使用atomic可以在代码实现上有效减少锁的密度。

关注

2
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。