[基础算法] 字符串哈希

[题目描述]

给定一个长度为 n的字符串,再给定 m个询问,每个询问包含四个整数 l1,r1,l2,r21,1,2,2,请你判断 [l1,r1]和 [l2,r2] 这两个区间所包含的字符串子串是否完全相同。

字符串中只包含大小写英文字母和数字。

输入格式

第一行包含整数 n和 m,表示字符串长度和询问次数。

第二行包含一个长度为 n 的字符串,字符串中只包含大小写英文字母和数字。

接下来 m 行,每行包含四个整数 l1,r1,l2,r2表示一次询问所涉及的两个区间。

注意,字符串的位置从 1 开始编号。

输出格式

对于每个询问输出一个结果,如果两个字符串子串完全相同则输出 Yes,否则输出 No

每个结果占一行。

数据范围

1≤n,m≤10e5

输入样例:

8 3
aabbaabb
1 3 5 7
1 3 6 8
1 2 1 2

输出样例:

Yes
No
Yes

思路描述: 

使得每一字符串都能用哈希值表示,比较两个区间的字符串,就是比较两个字符串的哈希值,若相等则说明两段字符串相等,反之则说明不相等。

那么如何表示两段区间的哈希值呢,可以基于前缀和的思想考虑这个问题,把字符串转换为p进制的数,实现不同的字符串映射到不同的数字。把1-i的所有字符串的哈希值用前缀和表示出来,即h[i],给出左端点l和右端点r,用前缀和的公式求出l~r的哈希值。

注意:

1.任何字符都不能映射成0,否则例如AAAA和AAA就会出现字符串不等,哈希值相等的情况。

2.前缀和的公式为 h[r] - h[l-1] * p[l-r+1](p[l-r+1]为P的r-l+1次方)

ACcode

//当我们要快速的判断两个字符串是不是相等的时候,可以用哈希表字符串的做法
#include <iostream>

using namespace std;

const int P =131,N=100010;  
typedef unsigned long long ULL;   //一般经验把P设为131或者13331,Q设为2^64时不会出现冲突的情况。
                                  //unsigned long long的范围为2^64,将数组设为该类型,若越界就相当于模了一遍
ULL h[N],p[N];                  //p为P的次方,P为进制,h[i]为1-i字符串的哈希值
char a[N];

ULL myget(int l, int r)
{
    return h[r] - h[l-1] * p[r-l+1];    //返回从h[r]到h[l]的哈希值
}

int main()
{
    int n,m;
    cin>>n>>m>>a+1;
    
    p[0]=1;
    for(int i=1;i<=n;i++)
    {
        p[i] = p[i-1] * P;       //构造p[i]为P的i次方
        h[i] = h[i-1] * P + a[i];//构造h[i]为1-i字符串的哈希值
    }
    while(m--)
    {
        int l1, r1, l2, r2;
        cin>>l1>>r1>>l2>>r2;
        if(myget(l1,r1) == myget(l2,r2)) puts("Yes");
        else puts("No");
    }
    return 0;
}

思考:

1.当我们需要比较某两段字符串是否相等时,可以采用前缀字符串哈希的方式

2.构造p进制的数,可以用以下形式,使得a数组构造为一个由左边为高位,右边为低位的数

for(int i=1;i<=n;i++)
{
    h[i] = h[i-1] * P + a[i] //h[0]==0
}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值