题目描述
给定一个长度为 n 的字符串,再给定 m 个询问,每个询问包含四个整数 l1,r1,l2,r2,
请你判断 [l1,r1] 和 [l2,r2]这两个区间所包含的字符串子串是否完全相同。
字符串中只包含大小写英文字母和数字。
输入格式
第一行包含整数 n和 m,表示字符串长度和询问次数。
第二行包含一个长度为 n的字符串,字符串中只包含大小写英文字母和数字。
接下来 m行,每行包含四个整数 l1,r1,l2,r2,表示一次询问所涉及的两个区间。
注意,字符串的位置从 1开始编号。
输出格式
对于每个询问输出一个结果,如果两个字符串子串完全相同则输出 Yes,否则输出 No。
每个结果占一行。
数据范围
1≤n,m≤105
输入样例:
8 3
aabbaabb
1 3 5 7
1 3 6 8
1 2 1 2
输出样例
Yes
No
Yes
字符串前缀哈希法
当输入字符串str = a b c d e f g时
h[0] = 0;
h[1] = a;
h[2] = a b;
h[i] 代表前i个字母的哈希值。
如何定义字符串的哈希值呢?
把字符串看成p进制的数,每一个字符表示p进制上的每一位数字。
若a b c d 分别代表1, 2, 3, 4;
那么
a b c d = (1 2 3 4)P,转化为数字是1xP^3 + 2xP^2 + 3xP^1 + 4xP^0;
转化的数字范围设为Q;
即把任意字符串映射到0 ~ Q-1上。
在映射过程中,注意以下三点:
1、不能映射成数字0
eg:若A = 0;
(A)p = 0;
(AA)p = 0;
(AAA)p = 0;
2、假定哈希数字不会起冲突。
储存结构的哈希可以容忍冲突并处理冲突,但字符串哈希方式假定没有冲突,并有一个经验完美值,即
3、根据前缀哈希利用公式求出子段哈希。
已知h[R],h[L-1],求L到R的哈希值
(如果不明白可以把十进制代进去,它的幂只是为了位运算时的对齐)
同理h[L-1]的最高位为1,即P^L-2;最低位为p^0;
于是,求L到R的哈希值为:
h[R] - h[L] x P ^ R-L+1;
'p ^ R-L+1'是为了让h[L]左移,可以想象成h[L - 1]从1到L-1的哈希值为123,h[R]为从1到R的哈希值,把h[L - 1]左移可以对齐,使得相减后得到L到R的哈希值为45.
C++ 代码
#include <iostream>
using namespace std;
typedef unsigned long long ULL;
const int N = 100010, P = 131;
int n, m;
char str[N];
ULL h[N], p[N];
ULL get(int l, int r)
{
return h[r] - h[l - 1] * p[r - l + 1];
}
int main()
{
scanf("%d%d", &n, &m);
scanf("%s", str + 1);
p[0] = 1;
for (int i = 1; i <= n; i ++ )
{
h[i] = h[i - 1] * P + str[i];
p[i] = p[i - 1] * P;
}
while (m -- )
{
int l1, r1, l2, r2;
scanf("%d%d%d%d", &l1, &r1, &l2, &r2);
if (get(l1, r1) == get(l2, r2)) puts("Yes");
else puts("No");
}
return 0;
}