Acwing-138. 兔子与兔子
很久很久以前,森林里住着一群兔子。
有一天,兔子们想要研究自己的 DNA 序列。
我们首先选取一个好长好长的 DNA 序列(小兔子是外星生物,DNA 序列可能包含 26 个小写英文字母)。
然后我们每次选择两个区间,询问如果用两个区间里的 DNA 序列分别生产出来两只兔子,这两个兔子是否一模一样。
注意两个兔子一模一样只可能是他们的 DNA 序列一模一样。
输入格式
第一行输入一个 DNA 字符串 S。
第二行一个数字 m,表示 m 次询问。
接下来 m 行,每行四个数字 l1,r1,l2,r2,分别表示此次询问的两个区间,注意字符串的位置从1开始编号。
输出格式
对于每次询问,输出一行表示结果。
如果两只兔子完全相同输出 Yes,否则输出 No(注意大小写)。
数据范围
1≤length(S),m≤1000000
输入样例:
aabbaabb
3
1 3 5 7
1 3 6 8
1 2 1 2
输出样例:
Yes
No
Yes
链接:https://www.acwing.com/problem/content/description/140/
思路:字符串Hash
字符串Hash函数把一个任意长度的字符串映射为一个非负整数,并且其冲突概率几乎为0.
取一个固定值P,把字符串看作P进制数。求出P进制数->10进制数对M的取模就是字符串的Hash值。一般我们取P = 131或P=13331,此时Hash值产生冲突的概率极低,只要Hash值相同,我们就可以认定字符串是相同的。通常我们取 M = 2 6 4 M=2^64 M=264 ,我们可以直接使用unsigned long long 类型来存这个Hash值,在计算时,自动对 2 6 4 2^64 264取模。
当我们知道Hash(i)值,求Hash(i+1) = Hash(i)*P+s[i+1]。例如:Hash(abcd) = Hash(abc)*P + d;
当我们求某一字符串中[l,r]的Hash值,我们可以使用 H a s h = H a s h [ r ] − H a s h [ l − 1 ] ∗ P r − l + 1 Hash = Hash[r] - Hash[l-1]*P^{r-l+1} Hash=Hash[r]−Hash[l−1]∗Pr−l+1来求出。
代码:
#include <bits/stdc++.h>
using namespace std;
const int maxn = 1000000+20;
const int base = 131; //使用131冲突率低
typedef unsigned long long ULL;
ULL p[maxn], Hash[maxn];
char s[maxn];
int main()
{
int m;
scanf("%s", s+1);
int len = strlen(s+1);
Hash[0] = 0;
p[0] = 1;
for(int i = 1; i <= len; i++){
Hash[i] = (Hash[i-1] * base + (s[i] - 'a' + 1));
p[i] = p[i-1] * base;
}
cin >> m;
int l1, r1, l2, r2;
while(m--) {
cin >> l1 >> r1 >> l2 >> r2;
if(Hash[r1] - Hash[l1-1] * p[r1-l1+1] == Hash[r2] - Hash[l2-1] * p[r2-l2+1])
cout << "Yes" << endl;
else
cout << "No" << endl;
}
return 0;
}