AcWing: 138.兔子与兔子和字符串hash的介绍_我们首先选取一个好长好长的 dna 序列(小兔子是外星生物,dna 序列可能包含 26 个-CSDN博客

本文链接：https://blog.csdn.net/iwant_/article/details/131582020

制作不易，点个赞再走呗

题目描述

很久很久以前，森林里住着一群兔子。

有一天，兔子们想要研究自己的 DNA 序列。

我们首先选取一个好长好长的 DNA 序列（小兔子是外星生物，DNA 序列可能包含 26 个小写英文字母）。

然后我们每次选择两个区间，询问如果用两个区间里的 DNA 序列分别生产出来两只兔子，这两个兔子是否一模一样。

注意两个兔子一模一样只可能是他们的 DNA 序列一模一样。

输入格式

第一行输入一个 DNA 字符串 S。

第二行一个数字 m，表示 m 次询问。

接下来 m 行，每行四个数字 l1,r1,l2,r2，分别表示此次询问的两个区间，注意字符串的位置从 11 开始编号。

输出格式

对于每次询问，输出一行表示结果。

如果两只兔子完全相同输出 Yes，否则输出 No（注意大小写）。

数据范围

1≤length(S),m≤1000000

输入样例：

aabbaabb
3
1 3 5 7
1 3 6 8
1 2 1 2

输出样例：

Yes
No
Yes

算法介绍

Hash(哈希)介绍

该题用到的算法是哈希；

简单来说就是把任意输入通过特定方式（hash函数）处理后生成一个值。这个值等同于存放数据的地址，这个地址里面再把输入的数据进行存储。
这个hash函数又叫散列函数，会有一些常用的构造散列函数的方法，但是处理结果值可能相同，那就叫冲突，冲突也有常用的冲突常用的冲突解决方法。

哈希的要点

哈希最重要的就是怎么得到哈希值，一般直接哈希得到的值会很大，所以一般要取模，为了使取模后精度比较高，一般使用unsigned long long 来存数据，而进行哈希使要乘的值也是有讲究的，经过人们的多次实验，一般取131，1331.....这样的精度比较高。

方法：

ULL p[N],ans[N];
int P = 131;
for(int i = 1; i <= len; i++)
	{
		ans[i] = ans[i-1] * P + str[i-1];
		p[i] = p[i-1] * P;
	}

当然，获取哈希值的方法不止这一种，要理解哈希的原理，就是将一个数值映射到另一个数进行储存（也可以是将一个字符或者是字符串映射到一个值上），这个获得的值的要求根据题意来判断。

解题思路

该题刚开始想可以直接用substr来获取两段的字符串直接判断，但是，根据查询资料得知，substr获取字符串的时间复杂度是线性的，最差可以是n，那么时间复杂度最高是n*n；对于该题来说时间复杂度太高了，所以不能直接用substr来写。

那么再想想可以用字符串哈希来写，将这个字符串的每一个前缀都用一个数值来表示，然后进行数值与数值之间的对比，这样时间复杂度就降下来了。

假设成立，下面就开始执行，那么该如何执行呢：

我们可以将每一个前缀字符串都用哈希的方式进行了储存，然后就是截取了。

那么要怎么处理呢：

ULL get(int l,int r)
{
	return ans[r] - ans[l-1] * p[r-l+1];
}

这样就获取该区域的哈希值，将两个区域的哈希值进行对比，然后进行判断就得出最后的答案。

代码

#include<iostream>
#include<cstring>
#include<algorithm>
using namespace std;

typedef unsigned long long ULL;

const int N = 1000005,P = 131;
char str[N];
ULL p[N],ans[N];

ULL get(int l,int r)
{
	return ans[r] - ans[l-1] * p[r-l+1];
}

int main (void)
{
	scanf("%s",str);
	int len = strlen(str);
	p[0] = 1;
	for(int i = 1; i <= len; i++)
	{
		ans[i] = ans[i-1] * P + str[i-1];
		p[i] = p[i-1] * P;
	}
	int n;
	scanf("%d",&n);
	for(int i = 0; i < n; i++)
	{
		int l1,r1,l2,r2;
		scanf("%d %d %d %d",&l1,&r1,&l2,&r2);
		if(get(l1,r1) == get(l2,r2))
		{
			printf("Yes\n");
		}
		else puts("No");
	}
	
	return 0;
}