分布式ID生成方案-snowflake算法

「已注销」

已于 2022-07-14 22:18:19 修改

阅读量3.3k

点赞数 1

分类专栏：系统设计文章标签：算法

于 2021-12-30 15:26:35 首次发布

本文链接：https://blog.csdn.net/majianfei1023/article/details/122238048

版权

本文介绍了分布式ID生成的重要性以及常见的生成方案，如UUID、数据库自增ID和Redis生成ID，并详细探讨了Twitter的雪花算法，包括其结构、优点和应对时钟回拨的策略。雪花算法因其唯一性、趋势递增性和高性能受到广泛应用。

摘要由CSDN通过智能技术生成

首发于微信公众号：【码农在新加坡】，欢迎关注。

背景

在互联网的业务系统中，涉及到各种各样的ID，这些ID需要保证全局唯一。我们称之为分布式ID，分布式ID需要满足唯一性、趋势递增性、高可用性、高性能等特点。

snowflake算法，也叫雪花算法，是其中的一种分布式ID生成方案。是twitter公司内部分布式项目采用的ID生成算法，开源后广受国内大厂的好评，在该算法影响下各大公司相继开发出各具特色的分布式生成器。

讲解雪花算法前，我们先概述一下分布式ID有哪些生成方案。

分布式ID有以下几种生成方式：

算法的核心思想是结合机器的网卡、当地时间、一个随记数来生成UUID。

优点：本地生成，生成简单，性能好，没有高可用风险
缺点：长度过长，存储冗余，且无序不可读，查询效率低

使用数据库的id自增策略，如 MySQL 的 auto_increment。并且可以使用多台数据库分别设置不同步长，生成不重复ID的策略来实现高可用。

优点：数据库生成的ID绝对有序，高可用实现方式简单
缺点：需要独立部署数据库实例，成本高，有性能瓶颈

Redis的所有命令操作都是单线程的，本身提供像 incr 和 increby 这样的自增原子命令，所以能保证生成的 ID 肯定是唯一有序的。

优点：不依赖于数据库，灵活方便，且性能优于数据库；数字ID天然排序，对分页或者需要排序的结果很有帮助。
缺点：如果系统中没有Redis，还需要引入新的组件，增加系统复杂度；需要编码和配置的工作量比较大。

考虑到单节点的性能瓶颈，可以使用 Redis 集群来获取更高的吞吐量。假如一个集群中有5台 Redis。可以初始化每台 Redis 的值分别是1, 2, 3, 4, 5，然后步长都是 5。各个 Redis 生成的 ID 为：

A：1, 6, 11, 16, 21
B：2, 7, 12, 17, 22
C：3, 8, 13, 18, 23
D：4, 9, 14, 19, 24
E：5, 10, 15, 20, 25

步长和初始值一定需要事先确定。使用 Redis 集群也可以防止单点故障的问题。
另外，比较适合使用

关注

专栏目录