1.字符串哈希处理什么问题?
针对某一字符串给定l1,r1,l2,r2,求[l1,r1],[l2,r2]两段区间的字符串是否相同,针对单次操作时间复杂度位o(n),n为字符串的长度
2.如何实现字符串哈希
思想将字符串变成一个p进制的数,来实现不同的字符串对应不同的哈希值,例如(ABCD)字符串的哈希值为(A*p^3 + B*p^2 + C*p^1 + D*p^0 )
3.注意事项
哈希值不能为0,若S=0,则SS = S*p + S,依然为0,因此无法区分字符串
对于哈希值的冲突问题,一般P=131或者P=13331,对2^64取模时一般不会有冲突
4.如何求区间哈希值
当对一个字符串预处理之后,若不同区间哈希值相同则说明是相同的子串,所以用前缀和区里字符串h[i] = h[i-1]*p+s[i],区间h[l,r]=h[r] - h[l] * p^r-l+1(h是p进制转换为的10进制数).
举例:字符串ABCDE 与 字符串ABC 将ABC左移2为得到ABC00,之后ACBCDE - ABC00=DE
#include<iostream>
using namespace std;
typedef unsigned long long ULL;
const int N=100010,P=131;
int n,m;
char str[N];
ULL h[N],p[N];
ULL get(int l,int r)// 当p = 131 q等于2^64-1时候hash冲突几率最小
{
return h[r]-h[l-1]*p[r-l+1];// 因此当h[i]溢出会自动取模
}
int main(void)
{
scanf("%d%d%s",&n,&m,str+1);
p[0]=1;
for(int i=1;i<=n;i++)
{
p[i]=p[i-1]*P;
h[i]=h[i-1]*P+str[i];
}
while(m--)
{
int l1,l2,r1,r2;
cin>>l1>>r1>>l2>>r2;
if(get(l1,r1) == get(l2,r2))puts("Yes");
else puts("No");
}
return 0;
}