CHAPTER_4 算法初步入门
4.2 散列
题目1:
给出给出N个正整数,再给出M个正整数,问这M个数中的每个数是否在N个数中出现过。(其中N,M<10^5且所有正整数均小于10^5)
思路:
(1)对每个M中的数,遍历N中的所有数,寻找是否有相等数。——时间复杂度O(MN)
(2)设置数组 bool h_table[10010],在读入N个数时进行预处理,当读入x时设置h_table[x]=1。对于M中每个数查询即可得到结果。——时间复杂度O(M+N),空间换时间
PS:
对于此题,每个数都小于10^5,因此数字直接作为数组下标可行。当数字过大时,需要使用Hash的方法将整数映射成数组下标,在映射过程种可能出现不同数字映射到同一个值,即出现了冲突
常用解决冲突方法:
(1)线性探查法 (2)平方探查法 (3)链地址法 (4)除留取余法
一般来说,不需要自己实现解决冲突的方法。可以使用C++标准模板库中的map来直接使用hash的功能(C++11以后可以使用unordered_map,速度更快)
题目2:
如何将一个二维整点P的坐标映射成一个可以唯一代表它的整数?
思路:
设P坐标为(x,y),其中0<=x,y<=Range。hash函数可以设置为:H(P)=x*Range+y,再根据整数hash的方法进一步映射到更小的范围。
题目3:
给出N个字符串(由恰好3位大写字母组成),再给出M个查询字符串,问每个查询字符串在N个字符串中出现的次数
思路:
把A~Z视为0~25,即3位字符串可以看为一个3位的26进制数字,将其转换为10进制即可映射到整数
参考代码:
#include<iostream>
#include<string>
using namespace std;
int h_function(string str) {
int num=0;
for(int i=0;i<str.size();i++){
num=num*26+int(str[i]-'A');
}
return num;
} //hash函数,将字符串映射成10进制整数
int main(){
string tmp;
int hashtable[26*26*26+1]={0}; //三位26进制数共有26^3种可能,因此hash表容量大小至少为26^3
int n,m;
cin>>n;
for(int i=0;i<n;i++){
cin>>tmp;
hashtable[h_function(tmp)]++;
} //输入N个字符串,并计入hash表
cin>>m;
for(int i=0;i<m;i++){
cin>>tmp;
cout<<hashtable[h_function(tmp)]<<endl;
} //M个字符串依次查询并输出
return 0;
}