138. 兔子与兔子(字符串 hash）_138兔子与兔子-CSDN博客

本文链接：https://blog.csdn.net/qq_43506138/article/details/95868739

题目描述：

很久很久以前，森林里住着一群兔子。

有一天，兔子们想要研究自己的 DNA 序列。

我们首先选取一个好长好长的 DNA 序列（小兔子是外星生物，DNA 序列可能包含 26 个小写英文字母）。

然后我们每次选择两个区间，询问如果用两个区间里的 DNA 序列分别生产出来两只兔子，这两个兔子是否一模一样。

注意两个兔子一模一样只可能是他们的 DNA 序列一模一样。
输入格式

第一行输入一个 DNA 字符串 S。

第二行一个数字 m，表示 m 次询问。

接下来 m 行，每行四个数字 l1,r1,l2,r2

，分别表示此次询问的两个区间，注意字符串的位置从1开始编号。
输出格式

对于每次询问，输出一行表示结果。

如果两只兔子完全相同输出 Yes，否则输出 No（注意大小写）。
数据范围

1≤length(S),m≤1000000

输入样例：

aabbaabb
3
1 3 5 7
1 3 6 8
1 2 1 2

输出样例：

Yes
No
Yes

分析：
此题只要掌握了字符串hash的技巧就可以很容易的做出来。
字符串hash是将字符串看成一个p进制数，然后取于mod 所得到的值就是hash值。
一般情况下将p看成131 或者13331.这样的得到的hash值不容易产生冲突。将mod看成2^64。所以可以直接将值设为无符号长整形。溢出就是对mod取摸。这样可以省掉%操作，效率更高。
一般除非特殊构造的数据，否则这样的p和mod是不会产生冲突值的。如果有这种特殊数据，则可以多对几组不同的mod和p进行操作。得到的值相同才认为字符串相等。
然后几个基本操作需要注意。
字符串s的hash值是hash（s）。那么在字符串s后面加一个字符c。所得到的值可以用下面公式计算得到：
hash(s +ｃ）＝hash(s) * p + value[c];
字符串t的哈希值为 hash（t ) = hash(s + t) - hash(s) *p^t;

已知上述两个操作。我们就可以用O(n)的时间得到一个字符串所有的前缀的hash值。用O(1)的时间得到一个字符串的子串的hash值。

#include"stdio.h"
#include"string.h"
#include"algorithm"
using namespace std;
//无符号
typedef unsigned long long ll;
#define p 131

char str[1000010];
int n;
ll f[1000010],q[1000010];

int main()
{
    scanf("%s",str + 1);
    f[0] = 0; q[0] = 1;
    int len = strlen(str + 1);
    for(int i = 1; i < len; i ++)
    {
        f[i] = f[i - 1] * p + (str[i] - 'a');
        q[i] = q[i - 1] * 131;
    }
    scanf("%d",&n);
    while(n --)
    {
        int l1,r1,l2,r2;
        scanf("%d%d%d%d",&l1,&r1,&l2,&r2);
        ll val1 = f[r1] - f[l1 - 1] * q[r1 - l1 + 1];
        ll val2 = f[r2] - f[l2 - 1] * q[r2 - l2 + 1];
        if(val1 == val2)
            printf("Yes\n");
        else
            printf("No\n");
    }
}