基本散列
以空间换时间,快速查找
bool hashTable[maxn] ={false};
可以初始化每个数在N个整数中未出现过,如果出现了x就令hashTable[x] = true。这样直接查找对应的hashTable的bool值就可以知道每个数是否出现过。
如果是统计出现次数,则使用:
int hashTable[maxn] = {0};
如果出现了x就令hashTable[x] ++
最后表中每个数对应下标的值就是出现的次数。
字符串hash
当hashTable[key]的key不为整数时,如何映射?字符串hash是指将一个字符串S映射为一个整数,使得该整数可以尽可能唯一的表示字符串S。
先假设字符串均由大写字母A~Z构成。不妨把A ~Z视为0 ~25,这样就把26个大写字母对应到了二十六进制中。接着按照二十六进制转换为十进制的思路,将字符串映射为唯一的整数,代码如下:
int hashFunc(char S[],int len){ //hash数组,将字符串S转换为整数
int id = 0;
for(int i =0;i<len;i++){
id = id*26 + (S[i]-'A'); //将26进制转换为10进制
}
return id;
}
如果字符串中出现了小写字母,那么就把A~Z作为0 ~25,而把a ~z作为26 ~51,这样就变成了五十二进制转换为十进制的问题:
int hashFunc(char S[],int len){
int id = 0;
for(int i =0;i<len;i++){
if(S[i] >= 'A' && S[i] <= 'Z'){
id = id*52 +(S[i]-'A');
}else{
id = id*52 +(S[i]-'a')+26;
}
}
return id;
}
如果出现了数字,一般有两种处理方法:
- 按照小写字母的处理办法,增大进制数至62
- 如果保证在字符串的末尾是确定个数的数字,那么就可以把前面英文字母的部分按前面的思路计算然后直接加上末尾的数字,如下:
int hashFunc(char S[],int len){
int id=0;
for(int i =0;i<len-1;i++){ //最后一位为数字
id = id *26 +(S[i]-'A');
}
id = id*10 +(S[len-1]-'0');
return id;
}