分布式唯一ID方案之雪花算法Snowflake

对于数据量庞大且需要考虑有序性时,那么可以使用雪花算法,当然既然要使用高性能工具,肯定是需要付出代价的,代价就是需要维护多个系统组件来保证高效生成有序的唯一ID。 下面从概念到实践一一介绍:

分布式唯一ID

  • 使用RocketMQ时,需要使用到分布式唯一ID

  • 消息可能会发生重复,所以要在消费端做幂等性,为了达到业务的幂等性,生产者必须要有一个唯一ID。

    需要满足以下条件:

    • 同一业务场景要全局唯一
    • 该ID必须是在消息的发送方进行生成发送到MQ
    • 消费端根据该ID进行判断是否重复,确保幂等性
  • 在哪里产生以及消费端进行判断做幂等性与该ID无关,此ID需要保证的特性:

    • 局部甚至全局唯一
    • 趋势递增

Snowflake算法

  • Snowflake是Twitter开源的分布式ID生成算法, 结果是一个Long型的ID,核心思想是:

    • 使用1位作为符号位,确定为0, 表示

    • 使用41位作为毫秒数

    • 使用10位作为机器的ID : 高5位是数据中心ID, 低5位是机器ID

    • 使用12位作为毫秒内的序列号,意味着每个节点每秒可以产生4096(212)个ID;该算法通过二进制的操作进行实现,单机每秒内理论上最多可以生成1000*(2^12),即409.6万个ID。

SnowflakeIdWorker

  • Snowflake算法Java实现SnowflakeIdWorker:
/**
 * Twitter_Snowflake<br>
 * SnowFlake的结构如下(每部分用-分开):<br>
 * 0 - 0000000000 0000000000 0000000000 0000000000 0 - 00000 - 00000 - 000000000000 <br>
 * 1位标识,由于long基本类型在Java中是带符号的,最高位是符号位,正数是0,负数是1,所以id一般是正数,最高位是0<br>
 * 41位时间截(毫秒级),注意,41位时间截不是存储当前时间的时间截,而是存储时间截的差值(当前时间截 - 开始时间截)
 * 得到的值),这里的的开始时间截,一般是我们的id生成器开始使用的时间,由我们程序来指定的(如下下面程序IdWorker类的startTime属性)。41位的时间截,可以使用69年,年T = (1L << 41) / (
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值