1. 雪花算法
雪花算法是一种分布式ID生成算法,首先它生产的是一个64bit位的ID,这64bit位中划分成多段:
- 第1个bit位:保留位,无实际作用
- 第2-42的bit位:这41位表示时间戳,精确到毫秒级别
- 第43-52的bit位:这10位表示专门负责生产ID的工作机器的id
- 第53-64的bit位:这12位表示序列号,也就是1毫秒内可以生成 2 12 2^{12} 212个不同的ID
优点:
- 毫秒数在高位,自增序列在低位,整个ID都是
趋势递增
的。 - 作为DB表的主键,索引效率高。
- 不依赖数据库等第三方系统,以服务的方式部署,稳定性更高,生成ID的性能也是非常高的。
- 高性能高可用:生成时不依赖于数据库,完全在内存中生成。
- 容量大,每秒中能生成数百万的自增ID。
- 可以根据自身业务特性分配bit位,非常灵活。
缺点:
- 强依赖机器时钟,如果机器上时钟回拨,会导致发号重复或者服务会处于不可用状态。
- 不是严格全局递增的。
2. 时钟回拨问题
由于雪花算法是依赖于服务器的时间的,所以如果机器发生了故障或者别的情况,对服务器的时间进行了回拨,那么会导致生成的ID可能发生重复。
3. 解决方案
保存过去一段时间内每一台机器在当前这一毫秒产生的ID的最大值
,比如使用Map形式,就是<machine_id,max_id>,这样如果某台机器发生了时钟回拨,直接在这台机器对应的max_id的基础上继续自增生成ID即可。
THE END.