字符串哈希

最新推荐文章于 2023-11-08 09:19:50 发布

huyidai

最新推荐文章于 2023-11-08 09:19:50 发布

阅读量432

点赞数

本文链接：https://blog.csdn.net/huyidai/article/details/104146092

版权

hash：

1.简单介绍

就是把任意长度的输入(又叫做映射)，通过hash算法，变换成固定长度的输出，该输出就是hash值。

通常运用在查找字符串中，通常的方法会一个一个的匹配字符串，这样的时间复杂度为O（n），而hash算法能将这个字符串映射为一个整数，就是哈希值。如果哈希值一样说明这个字符串一样，时间复杂度为O（1）。

2.Hash公式：

n=100010；

base=131或者1331（一个经验值，当为131或1331时不容易出现重复值）。
unsigned long long h[n]，p[n];（用unsigned long long相当于自动对2^64取模，所以不用担心溢出。

h[i]=h[i-1]*base+s[i]-'a'+1;
p[i]=p[i-1]*base;

例如：

代码：

#include<stdio.h>
#include<string.h>
int base=131;
char s[1000010];
unsigned long long h[1000010];
int main()
{
    scanf("%s",s+1);
    int n=strlen(s+1);
    for(int i=1;i<=n;i++)
    {
        h[i]=h[i-1]*base+s[i]-'a'+1;
    }
    for(int i=1;i<=n;i++)
    printf("%lld\n",h[i]);
    return 0;
}

除此之外，hash算法能够知道字符串的每一个前缀的哈希值，还能计算某一个子串（某一段字符串）的哈希值。

3.例题：

输入格式

第一行输入一个 DNA 字符串 S。

第二行一个数字 m，表示 m 次询问。

接下来 m 行，每行四个数字 l1,r1,l2,r2l1,r1,l2,r2，分别表示此次询问的两个区间，注意字符串的位置从1开始编号。

输出格式

对于每次询问，输出一行表示结果。

如果两只兔子完全相同输出 Yes，否则输出 No（注意大小写）。

数据范围

1≤length(S),m≤10000001≤length(S),m≤1000000

输入样例：

aabbaabb
3
1 3 5 7
1 3 6 8
1 2 1 2

输出样例：

Yes
No
Yes

代码：

#include<stdio.h>
#include<string.h>
int base=131;
char s[1000010];
unsigned long long h[1000010],p[1000010];
int main()
{
    int n,m,i,l1,r1,l2,r2;
    scanf("%s",s+1);
    n=strlen(s+1);
    p[0]=1;
    for(i=1;i<=n;i++)
    {
        h[i]=h[i-1]*base+s[i]-'a'+1;
        p[i]=p[i-1]*base;
    }
    scanf("%d",&m);
    while(m--)
    {
        scanf("%d%d%d%d",&l1,&r1,&l2,&r2);
        if((h[r1]-h[l1-1]*p[r1-l1+1])==(h[r2]-h[l2-1]*p[r2-l2+1]))
        printf("Yes\n");
        else
        printf("No\n");
    }
    return 0;
}

4.心得：

通过对hash算法的学习，了解到查找字符串在KMP算法和BF算法之外，时间复杂度更小O（1）的哈希算法。

而且能够查找所有前缀和任意子串。

huyidai

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
字符串哈希

hash：1.简单介绍就是把任意长度的输入(又叫做映射)，通过hash算法，变换成固定长度的输出，该输出就是hash值。通常运用在查找字符串中，通常的方法会一个一个的匹配字符串，这样的时间复杂度为O（n），而hash算法能将这个字符串映射为一个整数，就是哈希值。如果哈希值一样说明这个字符串一样，时间复杂度为O（1）。2.Hash公式：n=100010；base=131或者1...
复制链接

扫一扫