需求:
在数据结构中,哈希函数是用来将一个字符串(或任何其他类型)转化为小于哈希表大小且大于等于零的整数。一个好的哈希函数可以尽可能少地产生冲突。一种广泛使用的哈希函数算法是使用数值33,假设任何字符串都是基于33的一个大整数,比如:
hashcode("abcd") = (ascii(a) * 333 + ascii(b) * 332 + ascii(c) *33 + ascii(d)) % HASH_SIZE
= (97* 333 + 98 * 332 + 99 * 33 +100) % HASH_SIZE
= 3595978 % HASH_SIZE
其中HASH_SIZE表示哈希表的大小(可以假设一个哈希表就是一个索引0 ~ HASH_SIZE-1的数组)。
给出一个字符串作为key和一个哈希表的大小,返回这个字符串的哈希值。
分析:
1、最简单的想法就是逐个遍历字符数组的每个字符,求其ASCII码值和33对应次幂的乘积和,但是这样做会出现溢出的现象,因为和有可能超过long型数的范围
2、为了避免1中提到的溢出问题,可以多次求余。
3、对于"abcd",可以看成如下步骤
读取字符 和
a -> a
b -> a*33+b
c -> (a*33+b)*33+c
d -> ((a*33+b)*33+c)*33+d
......
所以可以得到和的初始值sum=key[0],之后sum=sum(i-1) * 33 + key[i]
代码:
class Solution {
/**
* @param key: A String you should hash
* @param HASH_SIZE: An integer
* @return an integer
*/
public int hashCode(char[] key,int HASH_SIZE) {
// write your code here
if(key == null || key.length == 0) {
return 0;
}
/*
//遍历字符数组,求对应的乘积加和,会溢出
long result = 0;
for(int i = 0; i < key.length; i++) {
result += key[i]*Math.pow(33, key.length-1-i);//会溢出
}
return (int)(result % HASH_SIZE);//会溢出
*/
//初始化和
long sum = key[0];
for(int i = 1; i < key.length; i++) {
sum = sum * 33 % HASH_SIZE + key[i];//及时取余,避免溢出
}
return (int)(sum % HASH_SIZE);
}
}