原题链接
题目描述
给定一个长度为n的字符串,再给定m个询问,每个询问包含四个整数l1,r1,l2,r2l1,r1,l2,r2,请你判断[l1,r1l1,r1]和[l2,r2l2,r2]这两个区间所包含的字符串子串是否完全相同。
字符串中只包含大小写英文字母和数字。
输入格式
第一行包含整数n和m,表示字符串长度和询问次数。
第二行包含一个长度为n的字符串,字符串中只包含大小写英文字母和数字。
接下来m行,每行包含四个整数l1,r1,l2,r2l1,r1,l2,r2,表示一次询问所涉及的两个区间。
注意,字符串的位置从1开始编号。
输出格式
对于每个询问输出一个结果,如果两个字符串子串完全相同则输出“Yes”,否则输出“No”。
每个结果占一行。
数据范围
1≤n,m≤105
输入样例
8 3
aabbaabb
1 3 5 7
1 3 6 8
1 2 1 2
输出样例
Yes
No
Yes
字符串哈希(字符串前缀哈希)
Hash映射公式:(x1∗pn−1+x2∗pn−2+…+xn∗p1)modQ
根据经验(至于为什么,可以查看这篇文章——字符串哈希碰撞问题)
- P一般取131或者13331
- Q一般取264
使字符串哈希碰撞概率小于百分之一
这里我们用unsigned long long 代替modQ,
- unsigned long long 类型
范围和表示能力:unsigned long long 是C/C++中无符号长整型,通常占据64位。它的取值范围是从0到2^64-1,即0到18,446,744,073,709,551,615。
当对应hash值>264时会自动mod(即从0开始);, 这样就不用手动hash了
举例:
字符串s=“abcde”
求h[s[3,5]]
h[1]=h["a"]=h["a"]
h[2]=h["ab"]=h["a"]*P+h["b"]
h[3]=h["abc"]=h["ab"]*P+h["c"]
h[4]=h["abcd"]=h["abc"]*P+h["d"]
h[5]=h["abcde"]=h["abcd"]*P+h["e"]
因此需要去除h[5]中的h[“ab”] 也就是pow(P,h[r-l+1]) ,即在h[5]位置下字符串中h[“ab”]的哈希值
h5[“ab”]=h2[“ab”]* P * P * P;
如果从l遍历r到依次减去h[“ab”]效率较低,容易超时
因此我们采用 前缀和思想
p[i+1]=p[i]*P;
利用p数组,存下当前位置字符串的哈希值
得出公式 h[s[l,r]]=h[r] - h[l-1] * p[r- l + 1)]
r-l+1 对应 要求的字符串有几个字符 ,这里是为了计算h5[“ab”]
AC代码
//字符串哈希+前缀和
#include<iostream>
#include<string>
using namespace std;
typedef unsigned long long ull;//unsigned long long 自动取模
const int N=1e5+10,P=131;//131 13331 进制
int h[N],p[N];//h数组存前i个字符的哈希值(前缀和),p数组存放每个 字符串 当前的哈希值(前缀和)
int n,m;
ull query(int l,int r)
{
return h[r]-h[l-1]*p[r-l+1];//相当于pow(P,r-l+1)
}
int main()
{
string s;
cin>>n>>m>>s;
p[0]=1;
h[0]=0;
for(int i=0;i<n;i++)
{
p[i+1]=p[i]*P;//记录当前字符串的哈希值
h[i+1]=h[i]*P+s[i];//记录前i+1个字符串的哈希值
}
while(m--)
{
int l1,r1,l2,r2;
cin>>l1>>r1>>l2>>r2;
if(query(l1,r1)==query(l2,r2)) puts("Yes");
else puts("No");
}
return 0;
}