分布式id生成器

Alice_whj

已于 2024-05-22 15:12:26 修改

阅读量261

点赞数

分类专栏：分布式文章标签： CPU cpu css3

于 2022-03-06 13:04:09 首次发布

本文链接：https://blog.csdn.net/Alice_whj/article/details/123308590

版权

分布式专栏收录该内容

3 篇文章 0 订阅

订阅专栏

自增主键
比不是自增随机的方式占用更小的内存
因为存储结构是B+树，自增是依次填满叶子节点的，随机插入会产生很多不满的节点，也就是相同的数据量会产生更多的节点，且节点分裂会造成插入消耗了更多的IO次数，消耗了性能。，每个节点都是占一页的
好处：唯一，递增，简短
坏处：分表分库不适合，存在安全漏洞，可以推测记录条数，暴露了数敏感信息

uuid：根据本机mac地址和时间戳生成的，坏处，不是自增的，太长

SnowFlake 算法（雪花算法）
snowflake是Twitter开源的分布式ID生成算法，结果是一个long型的ID。其核心思想是：使用41bit作为毫秒数，10bit作为机器的ID（5个bit是数据中心，5个bit的机器ID），12bit作为毫秒内的流水号，最后还有一个符号位，永远是0。snowflake算法所生成的ID结构
在这里插入图片描述

0 - 0000000000 0000000000 0000000000 0000000000 0 - 00000 - 00000 - 000000000000
1位标识，由于long基本类型在Java中是带符号的，最高位是符号位，正数是0，负数是1，所以id一般是正数，最高位是0
41位时间截(毫秒级)，注意，41位时间截不是存储当前时间的时间截，而是存储时间截的差值（当前时间截 - 开始时间截)
得到的值），这里的的开始时间截，一般是我们的id生成器开始使用的时间，由我们程序来指定的（如下下面程序IdWorker类的startTime属性）。41位的时间截，可以使用69年，年T = (1L << 41) / (1000L * 60 * 60 * 24 * 365) = 69
10位的数据机器位，可以部署在1024个节点，包括5位datacenterId和5位workerId
12位序列，毫秒内的计数，12位的计数顺序号支持每个节点每毫秒(同一机器，同一时间截)产生4096个ID序号
加起来刚好64位，为一个Long型。
SnowFlake的优点是，整体上按照时间自增排序，并且整个分布式系统内不会产生ID碰撞(由数据中心ID和机器ID作区分)，并且效率较高，经测试，SnowFlake每秒能够产生26万ID左右。

SnowFlake 算法的优点
1.生成ID时不依赖于DB，完全在内存生成，高性能高可用。2.ID呈趋势递增，后续插入索引树的时候性能较好。

SnowFlake 算法的缺点
依赖于系统时钟的一致性。如果某台机器的系统时钟回拨，有可能造成ID冲突，或者ID乱序

Alice_whj

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分布式id生成器

自增主键比不是自增随机的方式占用更小的内存因为存储结构是B+树，自增是依次填满叶子节点的，随机插入会产生很多不满的节点，也就是相同的数据量会产生更多的节点，且节点分裂会造成插入消耗了更多的IO次数，消耗了性能。，每个节点都是占一页的好处：唯一，递增，简短坏处：分表分库不适合，存在安全漏洞，可以推测记录条数，暴露了数敏感信息uuid：根据本机mac地址和时间戳生成的，坏处，不是自增的，太长SnowFlake 算法（雪花算法）snowflake是Twitter开源的分布式ID生成算法，结果是一个
复制链接

扫一扫