前几天写了一个分表程序,用的hash算法是crc32.分表的函数如下:
function _get_hash_table($station) {
$str = crc32($station);debug($str);
$hash = substr(abs($str), 0, 2);
return 'table'.($hash%10);
}
首先在本地32位window机上生成好数据并插入对应的表中。但是再把程序和数据传到服务器上(64为linux),发现查不到数据。经过排查后发现,原来服务器上crc32的结果和本地不同。再查php手册才知,crc32的接口原来和机器有关。
php手册的描述:
Because PHP's integer type is signed many crc32 checksums will result in negative integers on 32bit platforms. On 64bit installations all crc32() results will be positive integers though.
crc32返回的结果在32位机上会产生溢出,所以结果可能为负数。而在64位机上不会溢出,所以总是正值。
CRC算法是按字长位数bit进行计算的。
crc32函数会按照php中的两个常量参考计算 PHP_INT_SIZE,PHP_INT_MAX
这两个常量的定义:
整型数的字长和平台有关,尽管通常最大值是大约二十亿(32 位有符号)。PHP 不支持无符号整数。Integer值的字长可以用常量PHP_INT_SIZE来表示,自 PHP 4.4.0 和 PHP 5.0.5后,最大值可以用常量PHP_INT_MAX来表示。
输出下32位中PHP_INT_SIZE:4,PHP_INT_MAX:2147483647
输出下64位中PHP_INT_SIZE:8,PHP_INT_MAX:9223372036854775807
解决方法:
function _get_hash_table($station) {
$checksum = crc32($station);
//decbin($str);
if(8==PHP_INT_SIZE){//64位机,进行移位从处理成和32机一样
if($checksum >2147483647){
$checksum = $checksum&(2147483647);//对64位机的先进截取后32位
$checksum = ~($checksum-1);//取补码
$checksum = $checksum&2147483647;//由于补码操作的修改,但是这时的checksum是正值而不是负值
}
}
debug($checksum.':');
$hash = substr(abs($checksum), 0, 2);//此处的abs是完全必要的
return 'transit_dijkstra'.($hash%10);
}
这样