字符串哈希算法的应用（超级实用）

最新推荐文章于 2024-07-12 22:00:07 发布

_刘小雨

最新推荐文章于 2024-07-12 22:00:07 发布

阅读量898

点赞数 6

分类专栏： 02算法专栏

CSDN---刘小雨

本文链接：https://blog.csdn.net/qq_39486027/article/details/110285620

版权

02算法专栏专栏收录该内容

12 篇文章 0 订阅

订阅专栏

在这里插入图片描述

字符串哈希的方法：在刷一些字符串的题目中是非常实用的，是一个不得不掌握的“套路”。
下面讲述字符串哈希的方法。（主要是利用字符串的前缀哈希）

例如：字符串 str = “ABCD”;

第一步： 将上面的字符映射成从1开始的 A - 1; B - 2 …
第二步： 将上面的字符串看成是一个P进制的数（1234）_p 。这里的P 是一个经验值： 131 或者是13331.
第三步： 然后将上面的P进制的数转换成十进制的数字。然后mod 一个数字2⁶⁴. 为了保证不冲突。
（1 * P³ + 2 * P² + 3 * P ¹ + 4 * P ⁰） mod （2⁶⁴）.
这里映射成hash值是保证不冲突的，所以在这里不用考虑冲突处理的方式。

然后查找是否有相同字符串，就对比这一段的hash值是不是相同。按照上面的方式求的是前缀的hash值，但是中间一段的字符串的hash 值应该如何求呢？
在这里插入图片描述

题目：

给定一个长度为n的字符串，再给定m个询问，每个询问包含四个整数l1,r1,l2,r2，请你判断[l1,r1]和[l2,r2]这两个区间所包含的字符串子串是否完全相同。
字符串中只包含大小写英文字母和数字。
输入格式
第一行包含整数n和m，表示字符串长度和询问次数。
第二行包含一个长度为n的字符串，字符串中只包含大小写英文字母和数字。
接下来m行，每行包含四个整数l1,r1,l2,r2，表示一次询问所涉及的两个区间。
注意，字符串的位置从1开始编号。
输出格式
对于每个询问输出一个结果，如果两个字符串子串完全相同则输出“Yes”，否则输出“No”。
每个结果占一行。
数据范围
1≤n,m≤10⁵

输入样例：
8 3
aabbaabb
1 3 5 7
1 3 6 8
1 2 1 2

输出样例：
Yes
No
Yes

Code

#include <iostream>
using namespace std;

typedef unsigned long long ULL;
const int N = 100010, P = 131;  // 这里的P 是经验值 131 ，或者13331

int n,m;
char str[N];
// 这里用unsigned long long 存储就相当于mod 2 ^ 64, 因为超过了会溢出的
ULL h[N], p[N];   // h[]是存储字符串哈希值的  p[] 是存储p次方的  

ULL get(int l, int r)
{
    return h[r] - h[l -1] * p[r - l + 1];     // 区间hash 的公式
}

int main()
{
    scanf("%d%d%s", &n, &m, str + 1);
    
    p[0] = 1;
    for(int i=1; i<=n; i++)
    {
        p[i] = p[i-1] * P;  // p数组保存 计算的次方数
        h[i] = h[i-1] * P +str[i];   // 计算字符串的前缀，  后面的是0次 所以直接加上str[i]就行了
    }
    
    while(m -- )
    {
        int l1, r1, l2, r2;
        scanf("%d%d%d%d", &l1, &r1, &l2, &r2);
        if(get(l1, r1) == get(l2, r2)) cout << "Yes" << endl;
        else cout << "No" << endl;
    }
    return 0;
}