本文适用于所有需要保证标识唯一性的场景
一、模拟场景
假设唯一标识为用户ID,当有3个用户同时注册,生成用户ID的时间完全相同,如何保证ID的唯一性
二、已有解决方案?
网友们给出的方案很多,其中比较流行的方案如下所示:
md5(uniqid(md5(microtime(true)),true));
microtime( TRUE ) - 返回unix纪元以来的当前时间,精确到最接近的微秒(1568049494.73)
md5 ( string $str [, bool $raw_output = FALSE ] ) : string - 返回长度为32的原始十六进制格式数据
md5 ( string $str [, bool $raw_output = TRUE ] ) : string - 返回长度为16的原始二进制格式数据
uniqid ([ string $prefix = "" [, bool $more_entropy = TRUE ]] ) : string - 如果设置为 TRUE,uniqid() 会在返回的字符串结尾增加额外的熵(使用combined linear congruential generator), 使得唯一ID更具唯一性
从上面几个函数的功能来看,保证唯一性主要靠uniqid,接着看看该函数的源码:
PHP_FUNCTION(uniqid)
{
...
gettimeofday((struct timeval *) &tv, (struct timezone *) NULL);
sec = (int) tv.tv_sec;
usec = (int) (tv.tv_usec % 0x100000);
...
if (more_entropy) {
uniqid = strpprintf(0, "%s%08x%05x%.8F", prefix, sec, usec, php_combined_lcg() * 10);
} else {
uniqid = strpprintf(0, "%s%08x%05x", prefix, sec, usec);
}
RETURN_STR(uniqid);
}
uniqid 是由四个部分组成:
prefix - 调用者传递的字符串参数
sec - 当前时钟的秒
usec - 当前时钟的微秒
php_combined_lcg - 使用线性同余生成的一个墒值,为0 ~ 1 之间的随机数(如 0.12345678),由参数more_entropy决定是否生成
在高并发情况下,php1、php2、php3 在微秒级同时操作,sec、usec 均相同。当前缀 prefix 也相同时,保证唯一性只能靠php_combined_lcg,源码:
/*
* combinedLCG() returns a pseudo random number in the range of (0, 1).
* The function combines two CGs with periods of
* 2^31 - 85 and 2^31 - 249. The period of this function
* is equal to the product of both primes.
*/
#define MODMULT(a, b, c, m, s) q = s/a;s=b*(s-a*q)-c*q;if(s<0)s+=m
static void lcg_seed(void);
PHPAPI double php_combined_lcg(void) /* {
{
{ */
{
int32_t q;
int32_t z;
if (!LCG(seeded)) {
lcg_seed();
}
MODMULT(53668, 40014, 12211, 2147483563L, LCG(s1));
MODMULT(52774, 40692, 3791, 2147483399L, LCG(s2));
z = LCG(s1) - LCG(s2);
if (z < 1) {
z += 2147483562;
}
return z * 4.656613e-10;
}
/* }}} */
三、优化方案
由上面的分析可以看出,如果我们单纯使用 uniqid() 这个方法,不带任何参数的情况下只能保证单个进程/线程,在微秒级以上(毫秒级)是唯一的。如果使用uniqid(string $prefix, true), 增加墒值使用一个随机的方式保证唯一性。但是由于线性同余是比较简单的生成随机数的算法,随机性不足,所以,更优的方式是让 prefix 参数也不相同:
uniqid(mt_rand(), true)
其中 mt_rand() 生成随机数使用 Mersenne Twister Random Number Generator (梅森旋转算法),而不再是线性同余,范围为0 ~ 2147483647。换句话说,上面这个 id 由两种随机算法 + 时间戳生成。基本上,这个算法在很大程度上能保证唯一性了。如果需要固定位数的hash值,例如32位:
md5(uniqid(mt_rand(), true))
如果需要传参,例如用户使用手机号码注册,可以表示为:
$phone = '18600000000';
// 长度40
$uid = sha1(md5(uniqid(mt_rand(), true)).$phone);
本文分享 CSDN - SugarPPig。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。