MySQL函数UUID()产生重复键的说明
一、原理分析
UID 的全称是 Universally Unique Identifier,中文为通用唯一识别码,它有5个版本,MySQL中的UUID()返回一个符合UUID版本1的值,版本1是timestamp + MAC 地址,如RFC 4122中所述(https://www.ietf.org/rfc/rfc4122.txt)。该值是一个128位的数字,表示为五个十六进制数的utf8字符串,格式为AAAAA-bbbb-cccc-dddd-EEEE。关于这一点,MySQL的官网也有论述,其地址是https://dev.mysql.com/doc/refman/8.0/en/miscellaneous-functions.html#function_uuid。
MySQL函数uuid()随机产生数的原理:生成的uuid随机数是36位的,其中包含32个字符以及4个分隔符(-),例如de7ee642-4322-11e0-85ab-842b2b4a7e75,在实际开发中,常用replace()把“-”去掉。这32个字符中,分为5组。每一组数产生的机制如下:
UUID = time-low "-"
time-mid "-"
time-high-and-version "-"
clock-seq-and-reserved clock-seq-low "-"
node
1、前三组值是时间戳换算过来的;
2、 第四组值是暂时性保持时间戳的唯一性。只要不重启服务器,不变。
3、 第五组值是一个IEE 802的节点标识值,它是空间上唯一的,如果服务器地址不变,该值不变,
4、对于同一台机器,第五组值始终不会发生变化;
5、对于第四组,重新启动之后,会发现第四组的组与未重启前的值发生变化,
然后一直不变化,只要重新启动mysqld服务就会发生变化。
所以,在lexus的项目中,在批处理和发生拥塞的情况,前面三组时间戳相同是存在的,就会产生相同的uuid的值。
二、实验验证
三、解决方案
使用MD5函数重新计算,使其不同。
四、项目中的出现重复值的解决方案
方案1:使用MD5(),见上例
方案2:使用自定义的随机函数,自定义uuid的第四个版本
CREATE FUNCTION uuid_v4()
RETURNS BINARY(16)
BEGIN
-- Generate 8 2-byte strings that we will combine into a UUIDv4
SET @h1 = LPAD(HEX(FLOOR(RAND() * 0xffff)), 4, '0');
SET @h2 = LPAD(HEX(FLOOR(RAND() * 0xffff)), 4, '0');
SET @h3 = LPAD(HEX(FLOOR(RAND() * 0xffff)), 4, '0');
SET @h6 = LPAD(HEX(FLOOR(RAND() * 0xffff)), 4, '0');
SET @h7 = LPAD(HEX(FLOOR(RAND() * 0xffff)), 4, '0');
SET @h8 = LPAD(HEX(FLOOR(RAND() * 0xffff)), 4, '0');
-- 4th section will start with a 4 indicating the version
SET @h4 = CONCAT('4', LPAD(HEX(FLOOR(RAND() * 0x0fff)), 3, '0'));
-- 5th section first half-byte can only be 8, 9 A or B
SET @h5 = CONCAT(HEX(FLOOR(RAND() * 4 + 8)),
LPAD(HEX(FLOOR(RAND() * 0x0fff)), 3, '0'));
-- Build the complete UUID
RETURN UNHEX(LOWER(CONCAT(@h1, @h2, @h3, @h4, @h5, @h6, @h7, @h8)));
END;;