【算法】分布式ID神器之雪花算法简介

最新推荐文章于 2024-06-30 06:44:01 发布

测试@小成同学

最新推荐文章于 2024-06-30 06:44:01 发布

阅读量382

点赞数 4

分类专栏：算法文章标签：算法雪花算法

本文链接：https://blog.csdn.net/weixin_45589713/article/details/137084734

版权

算法专栏收录该内容

1 篇文章 0 订阅

订阅专栏

本文介绍了雪花算法，一种高效的分布式ID生成方案，具有系统环境ID不重复、高并发生成能力、基本有序递增和无依赖第三方库的特点。文章提供了Python实现示例，并对比了UUID、SnowFlake、UidGenerator和Leaf等竞品。雪花算法适用于生成设备唯一ID的场景。

摘要由CSDN通过智能技术生成

一、简介

在这里插入图片描述

二、优点

雪花算法，它至少有如下4个优点：

1.系统环境ID不重复
能满足高并发分布式系统环境ID不重复，比如大家熟知的分布式场景下的数据库表的ID生成。

2.生成效率极高
在高并发，以及分布式环境下，除了生成不重复 id，每秒可生成百万个不重复 id，生成效率极高。

3.保证基本有序递增
基于时间戳，可以保证基本有序递增，很多业务场景都有这个需求。

4.不依赖第三方库
不依赖第三方的库，或者中间件，算法简单，在内存中进行。

三、缺点

依赖服务器时间，服务器时钟回拨时可能会生成重复 id。

四、python 实现

以下示例中，SnowflakeGenerator类代表了一个雪花ID生成器。它使用当前时间戳、工作节点ID和数据中心ID来生成唯一的雪花ID。generate_id方法用于生成ID，它会根据时间戳、序列号和各个ID部分进行位运算，生成最终的64位雪花ID。

请注意，这只是一个简化的示例，实际应用中可能需要根据具体情况进行调整和扩展，例如添加容错处理、分布式部署等。另外，Snowflake算法在分布式环境中可以使用不同的节点ID和数据中心ID来确保生成的ID的唯一性。

import time

class SnowflakeGenerator:
    def __init__(self, worker_id, datacenter_id):
        self.worker_id = worker_id
        self.datacenter_id = datacenter_id
        self.sequence = 0
        self.last_timestamp = -1

    def generate_id(self):
        timestamp = int(time.time() * 1000)

        if timestamp < self.last_timestamp:
            raise Exception("Invalid system clock!")

        if timestamp == self.last_timestamp:
            self.sequence = (self.sequence + 1) & 4095
            if self.sequence == 0:
                timestamp = self.wait_next_millisecond(self.last_timestamp)
        else:
            self.sequence = 0

        self.last_timestamp = timestamp

        snowflake_id = (
            ((timestamp - 1609459200000) & 0x3FFFFFFFFFF) << 22
            | (self.datacenter_id & 0x1F) << 17
            | (self.worker_id & 0x1F) << 12
            | (self.sequence & 0xFFF)
        )

        return snowflake_id

    def wait_next_millisecond(self, last_timestamp):
        timestamp = int(time.time() * 1000)
        while timestamp <= last_timestamp:
            timestamp = int(time.time() * 1000)
        return timestamp

# 示例用法
generator = SnowflakeGenerator(worker_id=0, datacenter_id=0)
snowflake_id = generator.generate_id()
print(snowflake_id)