字符串哈希

hash:

1.简单介绍

就是把任意长度的输入(又叫做映射),通过hash算法,变换成固定长度的输出,该输出就是hash值。

通常运用在查找字符串中,通常的方法会一个一个的匹配字符串,这样的时间复杂度为O(n),而hash算法能将这个字符串映射为一个整数,就是哈希值。如果哈希值一样说明这个字符串一样,时间复杂度为O(1)。

2.Hash公式:

n=100010;

base=131或者1331(一个经验值,当为131或1331时不容易出现重复值)。
unsigned long long h[n],p[n];(用unsigned long long相当于自动对2^64取模,所以不用担心溢出。

h[i]=h[i-1]*base+s[i]-'a'+1;
p[i]=p[i-1]*base;

例如:

代码:

#include<stdio.h>
#include<string.h>
int base=131;
char s[1000010];
unsigned long long h[1000010];
int main()
{
    scanf("%s",s+1);
    int n=strlen(s+1);
    for(int i=1;i<=n;i++)
    {
        h[i]=h[i-1]*base+s[i]-'a'+1;
    }
    for(int i=1;i<=n;i++)
    printf("%lld\n",h[i]);
    return 0;
}

除此之外,hash算法能够知道字符串的每一个前缀的哈希值,还能计算某一个子串(某一段字符串)的哈希值。

3.例题:

输入格式

第一行输入一个 DNA 字符串 S。

第二行一个数字 m,表示 m 次询问。

接下来 m 行,每行四个数字 l1,r1,l2,r2l1,r1,l2,r2,分别表示此次询问的两个区间,注意字符串的位置从1开始编号。

输出格式

对于每次询问,输出一行表示结果。

如果两只兔子完全相同输出 Yes,否则输出 No(注意大小写)。

数据范围

1≤length(S),m≤10000001≤length(S),m≤1000000

输入样例:

aabbaabb
3
1 3 5 7
1 3 6 8
1 2 1 2

输出样例:

Yes
No
Yes

代码:

#include<stdio.h>
#include<string.h>
int base=131;
char s[1000010];
unsigned long long h[1000010],p[1000010];
int main()
{
    int n,m,i,l1,r1,l2,r2;
    scanf("%s",s+1);
    n=strlen(s+1);
    p[0]=1;
    for(i=1;i<=n;i++)
    {
        h[i]=h[i-1]*base+s[i]-'a'+1;
        p[i]=p[i-1]*base;
    }
    scanf("%d",&m);
    while(m--)
    {
        scanf("%d%d%d%d",&l1,&r1,&l2,&r2);
        if((h[r1]-h[l1-1]*p[r1-l1+1])==(h[r2]-h[l2-1]*p[r2-l2+1]))
        printf("Yes\n");
        else
        printf("No\n");
    }
    return 0;
}

4.心得:

通过对hash算法的学习,了解到查找字符串在KMP算法和BF算法之外,时间复杂度更小O(1)的哈希算法。

而且能够查找所有前缀和任意子串。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
字符串哈希算法是一种将字符串映射为数字的算法,常用于字符串的比较和匹配。在C++中,可以使用字符串哈希算法来加速字符串的比较操作。 引用\[1\]中的代码示例展示了一个使用字符串哈希算法的C++代码。该代码使用了前缀和数组和字符串数组来存储字符串,并通过计算哈希来比较两个子串是否相等。其中,哈希的计算使用了前缀和数组和幂运算。 引用\[2\]中的解释指出,使用字符串哈希的目的是为了比较字符串时不直接比较字符串本身,而是比较它们对应映射的数字。这样可以将子串的哈希的时间复杂度降低到O(1),从而节省时间。 引用\[3\]中的代码示例也展示了一个使用字符串哈希算法的C++代码。该代码使用了前缀和数组和字符串数组来存储字符串,并通过计算哈希来比较两个子串是否相等。与引用\[1\]中的代码类似,哈希的计算也使用了前缀和数组和幂运算。 综上所述,字符串哈希算法是一种将字符串映射为数字的算法,常用于字符串的比较和匹配。在C++中,可以使用前缀和数组和幂运算来计算字符串哈希,并通过比较哈希来判断两个子串是否相等。 #### 引用[.reference_title] - *1* [C++算法题 # 33 字符串哈希](https://blog.csdn.net/weixin_44536804/article/details/123425533)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [字符串哈希(c++)](https://blog.csdn.net/qq_41829492/article/details/120980055)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [AcWing 841. 字符串哈希(C++算法)](https://blog.csdn.net/YSA__/article/details/108453403)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值