1. 问题描述
1.1 UUID定义
UUID 是 通用唯一识别码(Universally Unique Identifier)的缩写,是一种软件建构的标准,亦为开放软件基金会组织在分布式计算环境领域的一部分。其目的,是让分布式系统中的所有元素,都能有唯一的辨识信息,而不需要通过中央控制端来做辨识信息的指定。如此一来,每个人都可以创建不与其它人冲突的UUID。
总结就是,uuid就是全球唯一不会重复。
在线生成地址:http://www.uuid.online/
uuid例子:8f615d2e-80c5-423f-a5a0-fbd6b8f9e264
1.2 UUID截取问题
UUID截取5位,生成10万条数据,统计分析是否会重复。
2. 案例验证
2.1 生成程序
/**
* 生成100000 UUID,截取5位
*
* @author zrj
* @since 2021/6/23
**/
public class UUIDTest {
public static void main(String[] args) {
String prefix = "HHH";
for (int i = 0; i < 100000; i++) {
String uuidSub = prefix + UUID.randomUUID().toString().substring(0, 5).toUpperCase();
System.out.println("INSERT INTO `category`.`uuid`(`code`) VALUES ('" + uuidSub + "');");
}
}
}
2.2 准备环境
-- 建表
CREATE TABLE `uuid` (
`code` varchar(255) DEFAULT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;
-- 导入数据
-- 全部统计 100001
select count(code) from uuid;
-- 去重统计 95324
select count(distinct code) from uuid;
-- 重复:100000 - 95324 = 4676
3. 分析总结
10万UUID截取5位,重复4676。
uuid全球唯一,但是只要截取就会重复概率就会增大。