分布式唯一id的生成—雪花算法（snowflake）

最新推荐文章于 2024-08-03 14:41:33 发布

鹤是能飞的书

最新推荐文章于 2024-08-03 14:41:33 发布

阅读量397

点赞数

文章标签：分布式 java 算法

本文链接：https://blog.csdn.net/weixin_42237651/article/details/113815586

版权

本文介绍了分布式系统中生成唯一ID的需求，对比了UUID、数据库自增ID和Redis等方案，重点讲解了雪花算法的原理和优点，包括64bit的结构划分，以及如何保证分布式环境下的唯一性。同时提到了算法依赖系统时间一致性的问题，以及解决方案如百度的UidGenerator和美团的Leaf系统。

摘要由CSDN通过智能技术生成

id生成系统的可用性要求：
高可用：发送请求时能创建成功；
低延迟：服务器响应要快；
高QPS：来10万个也及时创建成功并且返回。

uuid：jdk本地生成，性能高，但是是无序id。并且太长，有32位，8-4-4-12，不适合mysql数据库。
数据库主键自增：唯一性，自增有序，但是不适合集群使用，每次新增时都需要先读取数据库是否存在数据。达不到高QPS。
redis：可满足上述要求，但是维护成本高，配置麻烦。需要配置一套redis集群。

雪花算法：
1.可以根据时间有序生成；
2.生成的结果是一个64bit大小的整数，为Long型（转成String后是19位）；
3.分布式系统内不会产生ID重复。（每秒可生成26万个自增可排序id）;

SnowFlake算法的缺点：
依赖与系统时间的一致性，如果系统时间被回调，或者改变，可能会造成id冲突或者重复。
（可以使用百度的分布式唯一id生成器UidGenerator）（Leaf–美团点评分布式id生成系统）

在这里插入图片描述

这 64 个 bit 中，其中 1 个 bit 是不用的，然后用其中的 41 bit 作为毫秒数，用 10 bit 作为工作机器 id，12 bit 作为序列号。

第一个部分，是 1 个 bit：0，这个是无意义的。
第二个部分是 41 个 bit：表示的是时间戳。
第三个部分是 5 个 bit：表示的是机房 id，10001。
第四个部分是 5 个 bit：表示的是机器 id，1 1001。
第五个部分是 12 个 bit：表示的序号，就是某个机房某台机器上这一毫秒内同时生成的 id 的序号，0000 00000000。

①1 bit：是不用的，为啥呢？

因为二进制里第一个 bit 为如果是 1，那么都是负数，但是我们生成的 id 都是正数，所以第一个 bit 统一都是 0。

②41 bit：表示的是时间戳，单位是毫秒。

41 bit 可以表示的数字多达 2^41 - 1，也就是可以标识 2 ^ 41 - 1 个毫秒值，换算成年就是表示 69 年的时间。

③10 bit：记录工作机器 id，代表的是这个服务最多可以部署在 2^10 台机器上，也就是 1024 台机器。

但是 10 bit 里 5 个 bit 代表机房 id，5 个 bit 代表机器 id。意思就是最多代表 2 ^ 5 个机房（32 个机房），每个机房里可以代表 2 ^ 5 个机器（32 台机器），也可以根据自己公司的实际情况确定。

④12 bit：这个是用来记录同一个毫秒内产生的不同 id。

12 bit 可以代表的最大正整数是 2 ^ 12 - 1 = 4096，也就是说可以用这个 12 bit 代表的数字来区分同一个毫秒内的 4096 个不同的 id。

package com.liuscoding.springcloud.alibaba.controller;

import org.springframework.cloud.commons.util.IdUtils;

public class IdWorker {
   

//因为二进制里第一个 bit 为如果是 1，那么都是负数，但是我们生成的 id 都是正数，所以第一个 bit 统一都是 0。

    //机器ID  2进制5位  32位减掉1位 31个
    private long workerId;
    //机房ID 2进制5位  32位减掉1位 31个
    private long datacenterId;
    //代表一毫秒内生成的多个id的最新序号  12位 4096 -1 = 4095 个
    private long sequence;
    //设置一个时间初始值    2^41 - 1   差不多可以用69年
    private long twepoch = 1585644268888L;
    //5位的机器id
    private long workerIdBits = 5L;
    //5位的机房id
    private long datacenterIdBits = 5L;
    //每毫秒内产生的id数 2 的 12次方R
    private long sequenceBits = 12L;
    // 这个是二进制运算，就是5 bit最多只能有31个数字，也就是说机器id最多只能是32以内

最低0.47元/天解锁文章

鹤是能飞的书

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分布式唯一id的生成—雪花算法（snowflake）

id生成系统的可用性要求：高可用：发送请求时能创建成功；低延迟：服务器响应要快；高QPS：来10万个也及时创建成功并且返回。uuid：jdk本地生成，性能高，但是是无序id。并且太长，有32位，8-4-4-12，不适合mysql数据库。数据库主键自增：唯一性，自增有序，但是不适合集群使用，每次新增时都需要先读取数据库是否存在数据。达不到高QPS。redis：可满足上述要求，但是维护成本高，配置麻烦。需要配置一套redis集群。雪花算法：1.可以根据时间有序生成；2.生成的结果是一个64bi
复制链接

扫一扫