字符串哈希

最新推荐文章于 2022-10-05 21:35:17 发布

njuptACMcxk

最新推荐文章于 2022-10-05 21:35:17 发布

阅读量195

点赞数

分类专栏：字符串文章标签：字符串算法数据结构哈希表 acm竞赛

本文链接：https://blog.csdn.net/njuptACMcxk/article/details/104645851

版权

字符串专栏收录该内容

48 篇文章 1 订阅

订阅专栏

字符串哈希-兔子与兔子

题目：

很久很久以前，森林里住着一群兔子。

有一天，兔子们想要研究自己的 DNA 序列。

我们首先选取一个好长好长的 DNA 序列（小兔子是外星生物，DNA 序列可能包含 26 个小写英文字母）。

然后我们每次选择两个区间，询问如果用两个区间里的 DNA 序列分别生产出来两只兔子，这两个兔子是否一模一样。

注意两个兔子一模一样只可能是他们的 DNA 序列一模一样。

输入格式
第一行输入一个 DNA 字符串 S。

第二行一个数字 m，表示 m 次询问。

接下来 m 行，每行四个数字 l1,r1,l2,r2，分别表示此次询问的两个区间，注意字符串的位置从1开始编号。

输出格式
对于每次询问，输出一行表示结果。

如果两只兔子完全相同输出 Yes，否则输出 No（注意大小写）。

数据范围
1≤length(S),m≤1000000
输入样例：
aabbaabb
3
1 3 5 7
1 3 6 8
1 2 1 2
输出样例：
Yes
No
Yes

题意：

$m 个询问，每次给定两个区间，判断两个区间的子串是否相等。$

字符串哈希算法

$将给定字符串视作一个P进制的数，再对其每一个前缀进行求值并映射到hash数组中，当需要对该字符串中的子串\\进行比较时,就可以用O(1)的时间快速查询某段子串的哈希值。为了避免冲突，P通常取一些质数。$

EG:
$举例：字符串 s t r = " a b c a b " ，取 P = 131 ，即将 s t r 看作是一个 131 进制的数， a b c d . . . 视作 1, 2, 3, 4 . . . 。$

$① 、对其每一个前缀求值, 用数组 h 来存储：$
$h[1]=a=131^0×1，\\h[2]=ab=131^1×1+131^0×2，\\h[3]=abc=131^2×1+131^1×2+131^0×3,\\h[4]=abca=131^3×1+131^2×2+131^1×3+131^0×1,\\h[5]=abcab=131^4×1+131^3×2+131^2×3+131^1×1+131^0×2。$

$② 、计算子串的哈希值：$
$可见，h[i]=h[i-1]×131+(str[i]-'a\ '+1)。计算区间[l,r]之间字符串对应哈希值=h[r]-h[l-1]×131^{r-l+1}。\\注意：因为下标小的字符在高位，我们在作差过程中要将前缀先乘上数量级的差。因此我们用p数组存储131^i。$

模板代码:

#include <iostream>
#include <cstring>
#include <cstdio>
#define ull unsigned long long
using namespace std;
const int N=1e6+10;
const int base=131;
int n ,m;
ull h[N],p[N];

ull get(int l,int r)
{
    return h[r]-h[l-1]*p[r-l+1];
}

char s[N];

int main(){
    scanf("%s",s+1);
    n=strlen(s+1);  ///strlen(字符串首地址)
    cin >> m;
    
    p[0]=1;
    for(int i=1;i<=n;i++)
    {
        h[i]=h[i-1]*base+s[i]-'a'+1;
        p[i]=p[i-1]*base;
    }
    
    
    int l1,r1,l2,r2;
    while(m--)
    {
        scanf("%d%d%d%d",&l1,&r1,&l2,&r2);
        if(get(l1,r1)==get(l2,r2)) printf("Yes\n");
        else printf("No\n");
    }


    return 0;
}

njuptACMcxk

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
字符串哈希

字符串哈希题目：给定一个长度为n的字符串，再给定m个询问，每个询问包含四个整数l1,r1,l2,r2，请你判断[l1,r1]和[l2,r2]这两个区间所包含的字符串子串是否完全相同。字符串中只包含大小写英文字母和数字。输入格式第一行包含整数n和m，表示字符串长度和询问次数。第二行包含一个长度为n的字符串，字符串中只包含大小写英文字母和数字。接下来m行，每行包含四个整数l1,r1,l2...
复制链接

扫一扫