数据结构笔记-hash表
(1)哈希的定义:
哈希表是一种数据结构
哈希表表示了关键码值和记录的映射关系
(2)哈希的作用:
哈希表可以加快查找速度
减少存储数据的空间开销
(3)哈希的技巧
哈希可以使用unordered_map实现,也可以手写哈希。手写哈希耗时是unordered_map的三分之一
哈希的K值尽量取质数且其值远离于2n(我也不知道为什么)
哈希,如果出现负数,需要将原本的哈希数组空间开双倍。因为C++中负数取模运算会出现数据溢出(异常)。所以C++哈希将负数处理成正数确保正确:int k = (x%mod + mod)%mod;
1.常规hash表
例题:模拟散列表
维护一个集合,支持如下几种操作:
I x,插入一个整数 x;Q x,询问整数 x是否在集合中出现过;
现在要进行 N次操作,对于每个询问操作输出对应的结果。
拉链法
(相信hash数组每一个元素后面跟着一个链表(与图的邻接表存储写法一致))
#include<iostream>
#include<cstring>
using namespace std;
const int M = 1e5 + 10;
const int mod = 100003;
int h[M],e[M],ne[M],idx;
void insert(int x){
int k = (x%mod + mod)%mod;
e[idx] = x,ne[idx] = h[k],h[k] = idx,idx ++;
}
bool check(int x){
int k = (x%mod + mod) % mod;
for(int i = h[k];i != -1;i = ne[i]){
if(e[i] == x) return true;
}
return false;
}
int main(){
memset(h,-1,sizeof(h));
int n;
cin >> n;
while(n--){
char t;int x;
cin >> t >> x;
if(t == 'I') insert(x);
else{
if(check(x)) cout << "Yes" << endl;
else cout << "No" << endl;
}
}
return 0;
}
开放选址法
#include<iostream>
#include<cstring>
using namespace std;
const int M = 200003;
int h[M];
int find(int x){
int k = (x % M + M) % M;
while(h[k] != x && h[k] != 0x3f3f3f3f){
k++;
if(k == M) k = 0;
}
return k;
}
int main(){
int n;
cin >> n;
memset(h,0x3f,sizeof(h));
while(n--){
char t; int x;
cin >> t >> x;
int k = find(x);
if(t == 'I'){
int k = find(x);
h[k] = x;
}
else{
if(h[k] == x) cout << "Yes" << endl;
else cout << "No" << endl;
}
}
return 0;
}
2.字符串哈希
时间复杂度为O(1) (判断子串的效率上字符串哈希效率远超于KMP等算法 )
主要思想:把字符串处理成一个p进制的数,由于这个数很大,可以进行hash。用前缀数组记录各前缀字符串的哈希值。通过前缀数组查询快速查询子串
注意点:
1任意字符不可以映射成0,否则会出现不同的字符串都映射成0的情况,比如A,AA,AAA皆为0
2冲突问题:通过巧妙设置P (131 或 13331) , Q (264)的值,一般可以理解为不产生冲突。
3使用ULL可以处理溢出问题(不用再进行取模操作)
例题:字符串哈希
给定一个长度为 n的字符串,再给定 m个询问,每个询问包含四个整数 l1,r1,l2,r2,请你判断 [l1,r1] 和 [l2,r2] 这两个区间所包含的字符串子串是否完全相同。
字符串中只包含大小写英文字母和数字。
#include<iostream>
#include<cstdio>
using namespace std;
const int M = 1e5 + 10;
const int N = 100003,P = 131;
int n,T;
typedef unsigned long long ULL;
char str[M];
ULL h[N],p[N];
ULL check(int l, int r)
{
return h[r] - h[l - 1] * p[r - l + 1];
}
int main()
{
cin >> n >> T;
scanf("%s", str + 1);
p[0] = 1;
for(int i = 1;i <= n;++i){
p[i] = P * p[i - 1];
h[i] = h[i - 1] * P + str[i];
}
while(T--){
int l1,l2,r1,r2;
cin >> l1 >> r1 >> l2 >> r2;
if(check(l1,r1) == check(l2,r2)) cout << "Yes" << endl;
else cout << "No" << endl;
}
}