python版雪花算法生成唯一ID

一、雪花算法图解

理论一大堆,总结如下图:
在这里插入图片描述
下方为源码,返回的结果为19位,为10进制表示,使用二进制表示就是64位,所以不必有所疑惑。

二、源码

1、异常捕获块

文件名:exceptions.py

class InvalidSystemClock(Exception):
    """
    时钟回拨异常
    """
    pass
2、唯一id生成块

文件名:xuehuaid.py

# Twitter's Snowflake algorithm implementation which is used to generate distributed IDs.
# https://github.com/twitter-archive/snowflake/blob/snowflake-2010/src/main/scala/com/twitter/service/snowflake/IdWorker.scala

import time
import logging

from .exceptions import InvalidSystemClock


# 64位ID的划分
WORKER_ID_BITS = 5
DATACENTER_ID_BITS = 5
SEQUENCE_BITS = 12

# 最大取值计算
MAX_WORKER_ID = -1 ^ (-1 << WORKER_ID_BITS)  # 2**5-1 0b11111
MAX_DATACENTER_ID = -1 ^ (-1 << DATACENTER_ID_BITS)

# 移位偏移计算
WOKER_ID_SHIFT = SEQUENCE_BITS
DATACENTER_ID_SHIFT = SEQUENCE_BITS + WORKER_ID_BITS
TIMESTAMP_LEFT_SHIFT = SEQUENCE_BITS + WORKER_ID_BITS + DATACENTER_ID_BITS

# 序号循环掩码
SEQUENCE_MASK = -1 ^ (-1 << SEQUENCE_BITS)

# Twitter元年时间戳
TWEPOCH = 1288834974657


logger = logging.getLogger('flask.app')


class IdWorker(object):
    """
    用于生成IDs
    """

    def __init__(self, datacenter_id, worker_id, sequence=0):
        """
        初始化
        :param datacenter_id: 数据中心(机器区域)ID
        :param worker_id: 机器ID
        :param sequence: 其实序号
        """
        # sanity check
        if worker_id > MAX_WORKER_ID or worker_id < 0:
            raise ValueError('worker_id值越界')

        if datacenter_id > MAX_DATACENTER_ID or datacenter_id < 0:
            raise ValueError('datacenter_id值越界')

        self.worker_id = worker_id
        self.datacenter_id = datacenter_id
        self.sequence = sequence

        self.last_timestamp = -1  # 上次计算的时间戳

    def _gen_timestamp(self):
        """
        生成整数时间戳
        :return:int timestamp
        """
        return int(time.time() * 1000)

    def get_id(self):
        """
        获取新ID
        :return:
        """
        timestamp = self._gen_timestamp()

        # 时钟回拨
        if timestamp < self.last_timestamp:
            logging.error('clock is moving backwards. Rejecting requests until {}'.format(self.last_timestamp))
            raise InvalidSystemClock

        if timestamp == self.last_timestamp:
            self.sequence = (self.sequence + 1) & SEQUENCE_MASK
            if self.sequence == 0:
                timestamp = self._til_next_millis(self.last_timestamp)
        else:
            self.sequence = 0

        self.last_timestamp = timestamp

        new_id = ((timestamp - TWEPOCH) << TIMESTAMP_LEFT_SHIFT) | (self.datacenter_id << DATACENTER_ID_SHIFT) | \
                 (self.worker_id << WOKER_ID_SHIFT) | self.sequence
        return new_id

    def _til_next_millis(self, last_timestamp):
        """
        等到下一毫秒
        """
        timestamp = self._gen_timestamp()
        while timestamp <= last_timestamp:
            timestamp = self._gen_timestamp()
        return timestamp


if __name__ == '__main__':
    worker = IdWorker(1, 2, 0)
    print(worker.get_id())

三、python雪花库

当然,如果不嫌麻烦,可以安装python雪花id生成库,如下:

1、安装
pip install pysnowflake
2、启动

启动pysnowflake —pysnowflake基于Tornado开发,启动时相当于一个服务

snowflake_start_server \
--address=0.0.0.0 \
--port=8910 \
--dc=1 \
--worker=1 \
--log_file_prefix=/tmp/pysnowflask.log

参数说明:可以通过–help查看

—address:本机的IP地址默认localhost
—dc:数据中心唯一标识符默认为0
—worker:工作者唯一标识符默认为0
—log_file_prefix:日志文件所在位置

也可以后台启动,如下:

nohup snowflake_start_server --address=127.0.0.1 --port=8910 --dc=1 --worker=1 --log_file_prefix=/tmp/pysnowflask.log>/dev/null &
3、获取id
import snowflake.client
def get_snowflake_uuid():
    guid = snowflake.client.get_guid()
    return guid
get_snowflake_uuid()
4、注意
  • 对于并发项目,需要保证datacenter_id, worker_id组合的唯一性,不然也会出现相同ID的情况。
雪花算法,也叫做Snowflake算法,是一种分布式唯一ID生成算法。它的核心思想是,将一个64位的long型分成5个部分,分别表示时间戳、数据中心、机器编号、序列号等信息,然后将这些信息组合成一个64位的唯一ID。 具体实现如下: 1. 时间戳部分 时间戳部分占用42位,可以精确到毫秒级别。在Snowflake算法中,时间戳的起始时间可以自定义。一般情况下,我们可以将其设置为某个固定的时间,比如2010年1月1日。 2. 数据中心和机器编号部分 数据中心和机器编号部分共占用12位,可以分别表示4096个数据中心和每个数据中心下的4096个机器编号。这样就可以保证全局唯一性。 3. 序列号部分 序列号部分占用10位,可以表示1024个序列号。如果同一毫秒内生成ID超过1024个,就需要等到下一毫秒再继续生成。 实现代码如下: ```python import time class Snowflake: def __init__(self, datacenter_id, worker_id): self.datacenter_id = datacenter_id self.worker_id = worker_id self.start_time = 1262275200000 # 2010-01-01 00:00:00 self.last_timestamp = -1 self.sequence = 0 def _gen_timestamp(self): return int(time.time() * 1000) def _next_millis(self, last_timestamp): timestamp = self._gen_timestamp() while timestamp <= last_timestamp: timestamp = self._gen_timestamp() return timestamp def gen_id(self): timestamp = self._gen_timestamp() if timestamp < self.last_timestamp: raise ValueError('Clock moved backwards') if timestamp == self.last_timestamp: self.sequence = (self.sequence + 1) % 1024 if self.sequence == 0: timestamp = self._next_millis(self.last_timestamp) else: self.sequence = 0 self.last_timestamp = timestamp return ((timestamp - self.start_time) << 22) | \ (self.datacenter_id << 10) | \ (self.worker_id << 2) | \ self.sequence ``` 使用示例: ```python snowflake = Snowflake(datacenter_id=1, worker_id=1) for i in range(10): print(snowflake.gen_id()) ``` 输出结果: ``` 952323154510714880 952323154510714881 952323154510714882 952323154510714883 952323154510714884 952323154510714885 952323154510714886 952323154510714887 952323154510714888 952323154510714889 ``` 以上就是一个简单的雪花算法生成唯一ID的实现。
评论 14
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值