算法模板:字符串哈希
题目内容:
给定一个长度为 n 的字符串,再给定 m 个询问,每个询问包含四个整数 l1,r1,l2,r2,请你判断 [l1,r1] 和 [l2,r2]这两个区间所包含的字符串子串是否完全相同。字符串中只包含大小写英文字母和数字。
输入格式
第一行包含整数 n和 m,表示字符串长度和询问次数。
第二行包含一个长度为 n的字符串,字符串中只包含大小写英文字母和数字。接下来 m行,每行包含四个整数 l1,r1,l2,r2,表示一次询问所涉及的两个区间。注意,字符串的位置从 1开始编号。
输出格式
对于每个询问输出一个结果,如果两个字符串子串完全相同则输出 Yes
,否则输出 No
。
每个结果占一行。
数据范围
1≤n,m≤105
输入样例:
8 3
aabbaabb
1 3 5 7
1 3 6 8
1 2 1 2
输出样例:
Yes
No
Yes
题目链接:https://www.acwing.com/problem/content/843/
分析:
将输入的字符串变成是P进制的数字(哈希值),实现不同的字符串映射到不同的数字。对于类似X1X2X3…Xn-1Xn的字符串,采用字符串的ASCII码值乘上P的次方来计算哈希值。实现映射公式(X1*Pn-1+X12Pn-2+X13Pn-3+…+X1n-1P1+X1P0) mod Q.
注意:
- 任何字符都不可以映射成0,否则会出现不同的字符串都映射成0的情况,类似如A,AA,AAA等都为0;
- mod Q之后可能会出现哈希值冲突的情况,但是将P赋值为131或者13331,Q赋值为264,这样使得冲突的概率变得极小;
在比较不同的字符串是否相同的时候,就转化为对应的哈希值(不同字符串对应哈希值不同),通过比较哈希值就知道字符串是否相同。
求一个字符串的哈希值就相当于求前缀和,求一个字符串的子串哈希值就类似于求部分和。
求得哈希值的公式h[i]=h[i-1]*P+str[i];i∈[0,n-1]; h为储存哈希值码的数组,str[i]为储存字符串的数组区间哈希值公式 h[l,r]=h[r]-h[l-1]*Pr-l+1
区间和公式的理解: ABCDE 与 ABC 的前三个字符值是一样,只差两位,
乘上 P2 把 ABC 变为 ABC00,再用 ABCDE - ABC00 得到 DE 的哈希值。
C++CODE:
#include<iostream>
using namespace std;
typedef unsigned long long ULL;
const int N = 100010,P=131;
int n,m;
char str[N];//用来存输入的字符串
ULL h[N];//哈希值
ULL p[N];
ULL get(int l,int r){
return h[r]-h[l-1]*p[r-l+1];
}
int main(){
scanf("%d%d%s",&n,&m,str+1);
p[0]=1;//P的零次方
for(int i=1;i<=n;i++){
p[i]=p[i-1]*P;
h[i]=h[i-1]*P+str[i];
}
while(m--){
int l1,r1,l2,r2;
scanf("%d%d%d%d",&l1,&r1,&l2,&r2);
if(get(l1,r1)==get(l2,r2)) printf("Yes\n");
else printf("No\n");
}
return 0;
}