Little trick.html
1 哈希函数
理想的哈希函数保证每一个字符串对应惟一的哈希值。下面这个哈希函数是同窗在项目中遇到的。算法
unsigned int hash(char* s)
{
unsigned int h=0;
for(;*s;s++)
h = *s + h*31;
return h%HASHSIZE; //predefined hash size
}
能够看出,这个hash函数遍历字符串中每一个字符,经过将其ASCII码计算获得最终的哈希值h。 这样来确保前面提到的结果惟一性。 咱们在gdb中验证一下,有char*类型的字符串s为nnmm。s的第i个字符用s[i]或者*(s+i)表示。编程
(gdb) p s
$8 = 0x40071c "nnmm"
(gdb) p s[0]
$11 = 110 'n'
(gdb) p s[1]
$12 = 110 'n'
(gdb) p s[2]
$13 = 109 'm'
(gdb) p *s
$9 = 110 'n'
(gdb) p *s+1
$10 = 111
(gdb) p *(s+1)
$14 = 110 'n'
(gdb) p *(s+2)
$15 = 109 'm'
能够看到,直接打印第i个字符的同时也会输出该字符的ASCII码。 第i个字符在公式中转成ASCII码,而后算出unsigned int型的h。函数
ASCII码对照表
.net
1.1 哈希函数的对比
[1]中提到编程珠玑中的一个hash函数也是用的相似方法,代码以下:code
//用跟元素个数最接近的质数做为散列表的大小
#define NHASH 29989
#define MULT 31
unsigned in hash(char *p)
{
unsigned int h = 0;
for (; *p; p++)
h = MULT *h + *p;
return h % NHASH;
}
除此以外,[1]还对经常使用字符串哈希函数 BKDRHash,APHash,DJBHash,JSHash,RSHash,SDBMHash,PJWHash,ELFHash进行了量化比较。htm
1.2 哈希函数分类
[2]中把哈希函数分为以下几类:blog
加法Hash;
位运算Hash;
乘法Hash;
除法Hash;
查表Hash;
混合Hash;
其中咱们上文的函数属于乘法Hash,这种类型的Hash函数利用了乘法的不相关性(乘法的这种性质,最有名的莫过于平方取头尾的随机数生成算法,虽然这种算法效果并很差)。图片
jdk5.0里面的String类的hashCode()方法也使用乘法Hash。不过,它使用的乘数是31。推荐的乘数还有:131, 1313, 13131, 131313等等。字符串
Reference
2 字符串深度复制
char* str_dump(char* s)
{
int l=strlen(s)+1;
char* ns=(char*)malloc(l*sizeof(char));
strcpy(ns,s);//char *strcpy(char* dest, const char *src)
return ns;// possible be NULL
}