字符串Hash无论是在ACM竞赛中还是在工程中都有着广泛的应用,所以很有必要掌握好它的用法。主要分为两个部
分:Hash映射和冲突处理。而本文主要来详细讲解Hash映射的方法及应用,下篇文章将会介绍如何处理冲突。
对于字符串Hash来说都是把字符串映射为一个整数,这一步是通过Hash函数来进行的。常用的Hash函数具体有:
SDBMHash,RSHash,JSHash,ELFHash,BKDRHash,DJBHash等等。接下来只详细介绍ELFHash函数的原理
及应用。
ELFHash函数的代码如下
unsigned int ELFhash(char *str)
{
unsigned int h = 0;
unsigned int x;
while(*str)
{
h = (h << 4) + *str++;
x = h & 0xF0000000L;
if(x)
{
h ^= x>>24;
h &= ~x;
}
}
return h & 0x7FFFFFFF;
}
接下来我会详细探讨它的原理。
(1)h = (h << 4) + *str++; 把当前的字符的ASCII存入h的低4位。
(2)x = h & 0xF0000000L; 取出h中最高4位,0xF0000000L地代表28~31这4位是1,其余后28位是0。
(3)如果最高4位不为0,那么说明字符多于7个,现在正在存第8个,如果不处理再加下一个字符时,第一个字符会
被移出,因为1~4位刚刚加入了新字符,所以不能>>28,而是>>24。
(4)h &= ~x; 表示把h的高4位清零。