一般哈希
哈希表是一种提供了快速插入和查找操作的数据结构,一般哈希可以用两种方法来做,拉链法和开放寻址法。
拉链法
在哈希表中的每个单元格内插上链表,链表中存储数据本身,查找时只需要找到数据的映射,也就是哈希值
例题
维护一个集合,支持如下几种操作:
“I x”,插入一个数x; “Q x”,询问数x是否在集合中出现过; 现在要进行N次操作,对于每个询问操作输出对应的结果。
输入格式
第一行包含整数N,表示操作数量。
接下来N行,每行包含一个操作指令,操作指令为”I x”,”Q x”中的一种。
输出格式
对于每个询问指令“Q x”,输出一个询问结果,如果x在集合中出现过,则输出“Yes”,否则输出“No”。
每个结果占一行。
数据范围
1≤N≤105
−109≤x≤109
输入样例:
5
I 1
I 2
I 3
Q 2
Q 5
输出样例:
Yes
No
代码:
#include<iostream>
#include<cstring>
using namespace std;
const int N = 100003;
int h[N], e[N], ne[N], idx;
void insert(int x)
{
int k = (x % N + N) % N;
e[idx] = x;
ne[idx] = h[k];
h[k] = idx ++ ;
}
bool find(int x)
{
int k = (x % N + N) % N;
for(int i = h[k]; i != -1; i = ne[i])
if(e[i] == x) return true;
return false;
}
int main()
{
int n;
cin >> n;
int x;
memset(h, -1, sizeof h);
while(n -- )
{
char op[2];
scanf("%s%d", op, &x);
if(op[0] == 'I') insert(x);
else
{
if(find(x)) puts("Yes");
else puts("No");
}
}
return 0;
}
开放寻址法
发生冲突时,查找数组中是否有空位,然后插入数据
与上面同样的例题
维护一个集合,支持如下几种操作:
“I x”,插入一个数x; “Q x”,询问数x是否在集合中出现过; 现在要进行N次操作,对于每个询问操作输出对应的结果。
输入格式
第一行包含整数N,表示操作数量。
接下来N行,每行包含一个操作指令,操作指令为”I x”,”Q x”中的一种。
输出格式
对于每个询问指令“Q x”,输出一个询问结果,如果x在集合中出现过,则输出“Yes”,否则输出“No”。
每个结果占一行。
数据范围
1≤N≤105
−109≤x≤109
输入样例:
5
I 1
I 2
I 3
Q 2
Q 5
输出样例:
Yes
No
代码:
#include<iostream>
#include<cstring>
using namespace std;
const int N = 200003, null = 0x3f3f3f3f;
int h[N];
int find(int x)
{
int k = (x % N + N) % N;
while(h[k] != null && h[k] != x)
{
k ++ ;
if(k == N) k = 0;
}
return k;
}
int main()
{
int n;
scanf("%d", &n);
memset(h, 0x3f, sizeof h);
while(n -- )
{
char op[2];
int x;
scanf("%s%d", op, &x);
int k = find(x);
if(op[0] == 'I') h[k] = x;//插入
else
{
if(h[k] != null ) puts("Yes");
else puts("No");
}
}
return 0;
}
字符串哈希
字符串哈希:将一串字符串映射成一个P进制的数。
P通过前缀和记录,查询某个字符串的哈希值时可以用前缀和相减。
P一般取131 或13331来减少冲突 。
为了避免手动取模, 使用unsigned long long 存储每串字符串的哈希值,值过大自动溢出,相当于取模
例题
给定一个长度为n的字符串,再给定m个询问,每个询问包含四个整数l1,r1,l2,r2,请你判断[l1,r1]和[l2,r2]这两个区间所包含的字符串子串是否完全相同。
字符串中只包含大小写英文字母和数字。
输入格式
第一行包含整数n和m,表示字符串长度和询问次数。
第二行包含一个长度为n的字符串,字符串中只包含大小写英文字母和数字。
接下来m行,每行包含四个整数l1,r1,l2,r2,表示一次询问所涉及的两个区间。
注意,字符串的位置从1开始编号。
输出格式
对于每个询问输出一个结果,如果两个字符串子串完全相同则输出“Yes”,否则输出“No”。
每个结果占一行。
数据范围
1≤n,m≤105
输入样例:
8 3
aabbaabb
1 3 5 7
1 3 6 8
1 2 1 2
输出样例:
Yes
No
Yes
举例了解一下过程:
比如样例中 aabbaabb , 如果我们想求baa的哈希值,需要用母串中aabbaa对应的哈希值减去前面aab的对应哈希值,根据h[i] = h[i - 1] * P + str[i];(前缀和计算)
,但是由于aab的阶数此时不能与母串中的aab相互抵消,所以要将aab的哈希值乘一个关于P的系数,比如此例将aab提高了三位才能抵消,得出目标字符串的哈希值的一步就是h[r] - h[l - 1] * p[r - l + 1]
,这一步就是准确计算出哈希值的关键。
#include<iostream>
using namespace std;
typedef unsigned long long ULL;
const int N = 100010, P = 131;
int n, m;
char str[N];
ULL h[N], p[N];
int get(int l, int r)
{
return h[r] - h[l - 1] * p[r - l + 1];
}
int main()
{
cin >> n >> m >> str + 1 ;
p[0] = 1;
for(int i = 1; i <= n; i ++ )
{
p[i] = p[i - 1] * P;
h[i] = h[i - 1] * P + str[i];//前缀和维护哈希值
}
while(m -- )
{
int l1, r1, l2, r2;
cin >> l1 >> r1 >> l2 >> r2;
if(get(l1, r1) == get(l2, r2)) puts("Yes");
else puts("No");
}
return 0;
}
关于前缀和的使用进入—>前缀和