题目描述:
很久很久以前,森林里住着一群兔子。
有一天,兔子们想要研究自己的 DNA 序列。
我们首先选取一个好长好长的 DNA 序列(小兔子是外星生物,DNA 序列可能包含 26 个小写英文字母)。
然后我们每次选择两个区间,询问如果用两个区间里的 DNA 序列分别生产出来两只兔子,这两个兔子是否一模一样。
注意两个兔子一模一样只可能是他们的 DNA 序列一模一样。
输入格式
第一行输入一个 DNA 字符串 S。
第二行一个数字 m,表示 m 次询问。
接下来 m 行,每行四个数字 l1,r1,l2,r2
,分别表示此次询问的两个区间,注意字符串的位置从1开始编号。
输出格式
对于每次询问,输出一行表示结果。
如果两只兔子完全相同输出 Yes,否则输出 No(注意大小写)。
数据范围
1≤length(S),m≤1000000
输入样例:
aabbaabb
3
1 3 5 7
1 3 6 8
1 2 1 2
输出样例:
Yes
No
Yes
分析:
此题只要掌握了字符串hash的技巧就可以很容易的做出来。
字符串hash是将字符串看成一个p进制数,然后取于mod 所得到的值就是hash值。
一般情况下将p看成131 或者13331.这样的得到的hash值不容易产生冲突。将mod看成2^64。所以可以直接将值设为无符号长整形。溢出就是对mod取摸。这样可以省掉%操作,效率更高。
一般除非特殊构造的数据,否则这样的p和mod是不会产生冲突值的。如果有这种特殊数据,则可以多对几组不同的mod和p进行操作。得到的值相同才认为字符串相等。
然后几个基本操作需要注意。
字符串s的hash值是hash(s)。那么在字符串s后面加一个字符c。所得到的值可以用下面公式计算得到:
hash(s +c)=hash(s) * p + value[c];
字符串t的哈希值为 hash(t ) = hash(s + t) - hash(s) *p^t;
已知上述两个操作。我们就可以用O(n)的时间得到一个字符串所有的前缀的hash值。用O(1)的时间得到一个字符串的子串的hash值。
#include"stdio.h"
#include"string.h"
#include"algorithm"
using namespace std;
//无符号
typedef unsigned long long ll;
#define p 131
char str[1000010];
int n;
ll f[1000010],q[1000010];
int main()
{
scanf("%s",str + 1);
f[0] = 0; q[0] = 1;
int len = strlen(str + 1);
for(int i = 1; i < len; i ++)
{
f[i] = f[i - 1] * p + (str[i] - 'a');
q[i] = q[i - 1] * 131;
}
scanf("%d",&n);
while(n --)
{
int l1,r1,l2,r2;
scanf("%d%d%d%d",&l1,&r1,&l2,&r2);
ll val1 = f[r1] - f[l1 - 1] * q[r1 - l1 + 1];
ll val2 = f[r2] - f[l2 - 1] * q[r2 - l2 + 1];
if(val1 == val2)
printf("Yes\n");
else
printf("No\n");
}
}