Go 语言 UUID 库 google/uuid 源码解析:时钟信息

google/uuid 库地址

google/uuid 时间相关的部分汇聚在 uuid 包下的 time.go 文件中。

UUID 的 RFC 4122 变体中的版本1和版本2依赖于时钟信息,所以 uuid 库将时钟信息的实现定义在本文件中,供对应版本 UUID 的生成使用。

UUID 依赖于时钟信息的实现版本包含两方面的时钟信息:时间和时钟序列。下面将针对时间和时钟序列进行详细介绍。

时间

UUID版本1和版本2的规范,根据RFC 4122,使用的是自1582年10月15日以来的100纳秒数作为时间戳。

这部分信息被存储在 int64 类型中,其声明如下:

type Time int64

而时间戳的生成可以拆分为两部分,go 原生支持的 time.Now().UnixNano 和 Unix 纪元与格里历改日的差。

go 原生支持的 time.Now().UnixNano() 可以获取到距离 Unix 纪年(1970年1月1日00:00:00 UTC)的纳秒数,而我们需要的是距离格里历改日(1582年10月15日)的100纳秒数,所以除了对 time.Now().UnixNano() 除以 100 外还需要补充 Unix 纪元到格里历改日的差。

其实现如下:

const (
	lillian    = 2299160          // 1582年10月15日的儒略日
	unix       = 2440587          // 1970年1月1日的儒略日
	epoch      = unix - lillian   // 两个纪元之间的天数
	g1582      = epoch * 86400    // 两个纪元之间的秒数
	g1582ns100 = g1582 * 10000000 // 两个纪元之间的100纳秒数
)

其先定义Unix 纪元和格里历改日的儒略日常量,然后将其做差得到两个纪元之间的天数,乘以每天的总秒数 86400,最后乘以 10^7 得到两个纪元之间的100纳秒数。

所以最后时间戳的实现如下:

now := uint64(t.UnixNano()/100) + g1582ns100

时钟序列

时钟序列(clock sequence)在UUID(特别是版本1和版本2)中的使用主要是为了处理两种特定的情况,以确保UUID的唯一性:

  1. 时钟回拨:如果系统时钟被设置回一个较早的时间,那么在此期间生成的UUID可能会与之前生成的UUID发生冲突,因为它们可能会有相同的时间戳部分。通过在时钟回拨时改变时钟序列,可以保证即使在相同的时间戳下,生成的UUID也是唯一的。

  2. 快速生成UUID:在非常短的时间内(小于UUID时间戳分辨率的时间内)生成大量的UUID时,可能会耗尽给定时间戳内的所有可能的UUID。时钟序列提供了一种机制,允许在这种情况下通过改变时钟序列来继续生成唯一的UUID,而不是等待下一个时间戳。

但在 google/uuid 库中只用于解决时钟回拨,只有但发生时钟回拨时,才会增加时钟序列。

时钟序列通常占 16 位(2字节),最高的两位被固定用于特定目的,在此库中用于标识变体。

时钟序列在 google/uuid 库中的实现逻辑书写于 setClockSequence 函数中,实现原理是先生成两个 byte(uint8) 的序列然后拼凑成一个 uint16 的序列,最后抹除高2位并在最高位设置变体标识1。

func setClockSequence(seq int) {
	// 当传入 -1 时,代表着需要随机生成一个时钟序列值。
	if seq == -1 {
		// 长度为 2 的字节切片数组,用于存储随机生成的字节。
		var b [2]byte
		// randomBits 向 b 中随机填充字节。
		randomBits(b[:]) 
		// b[0] 成为 seq 的高 8 位,b[1] 为低 8 位。
		seq = int(b[0])<<8 | int(b[1])
	}
	// 将当前的时钟序列值保存到oldSeq变量中,以便后续比较。
	oldSeq := clockSeq
	// 设置我们的变体
	clockSeq = uint16(seq&0x3fff) | 0x8000
	// 时钟回拨导致时钟序列调整,调整时钟序列后更新 lasttime
	if oldSeq != clockSeq {
		lasttime = 0
	}
}

这段代码的难点有两处:

首先是:

seq = int(b[0])<<8 | int(b[1])

实现我们知道,我么使用 randomBits(b[:]) 的目的就是往切片数组 b 中填充数据,并且 byte 在 Go 中也等同于 uint8。那么在这段代码中,b 数组相当于存储了两个 uint8 的数。int(b[0]) 意味着将 uint8 转为 intint 虽然不同系统位数不同,但是相比于 uint8 都有一个特点,就是拥有更多的位数。int(b[1]) 也同理。现在我们假设 b[0] 二进制数表示为:10101010b[1] 二进制数表示为:01010101。则int(b[0]) 二进制数表示为 00000000 00000000 00000000 10101010int(b[1]) 二进制数表示为 00000000 00000000 00000000 01010101int(b[0])<<8 便是 00000000 00000000 10101010 00000000。于是 int(b[0])<<8 | int(b[1]) 二进制表示为 00000000 00000000 10101010 01010101

总而言之seq = int(b[0])<<8 | int(b[1])就是将 b 数组的两个字节转换为一个整数,b[0]作为高8位,b[1]作为低 8 位。这个整数将作为创建最终时钟序列值的蓝图,此时 seq 虽然是 int 类型,但是其只有低 16 位。

再就是:

clockSeq = uint16(seq&0x3fff) | 0x8000

我们知道 seq 类型虽然为 int,但其只有低 16 位,而 0x3fff 其实是 0011 11111111,所以 seq&0x3fff 其实就是保留低 14 位的值并抹去高 2 位的值。uint16(seq&0x3fff) 便是将结果转位 uint160x80001000 0000 0000 0000,所以 | 0x8000 其实是将最高位设置为 1,表示变体1。

完整时钟信息生成

  1. 获取当前时间
  2. 如果未初始化时钟序列则随机生成时钟序列
  3. 得到时间戳
  4. 当发生时钟回拨时,增加时钟序列避免重复 UUID 的出现。
  5. 记录此次生成 UUID 的时间
func getTime() (Time, uint16, error) {
	t := timeNow()

	// 如果我们还没有一个时钟序列,就设置一个。
	if clockSeq == 0 {
		setClockSequence(-1)
	}
	now := uint64(t.UnixNano()/100) + g1582ns100

	// 如果当前时间与上次生成 UUID 时间相比有倒退,则我们增加时钟序列
	if now <= lasttime {
		clockSeq = ((clockSeq + 1) & 0x3fff) | 0x8000
	}
	// 记录此次生成 UUID 的时间
	lasttime = now
	return Time(now), clockSeq, nil
}
  • 30
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值