字符串哈希

目录

应用场景:

字符串的哈希的实现步骤:

注意点:

模板公式:

解决实际问题

题目分析:

代码实现:


应用场景:

对于求解区间内部的一段字母是否相同时,可以考虑字符串哈希的方法,可以使时间复杂度达到O(1)的效果,在很多算法题目中可以替代KMP的作用。

字符串的哈希的实现步骤:

1.把字符串看作p进制的数 通常取p为131 13331
2.将这个数转换为十进制的数
3.将得到的十进制的数对Q取模

注意点:

哈希值一般不能映射成0
哈希数字可能出现冲突 在哈希字符串时 完全不考虑冲突
当取p=131 13331 Q=2^64
在c++中如果unsinged long long结果溢出 相当于模了一个2^64
一般hash(0)=0;整个字符串的下标从1开始 读取字符串的时候也应该从1开始读入

模板公式:

求字符串前缀和的哈希值:

hash(i+1) = hash(i)*p+str[i+1];
求指定区间的字符串对应的哈希值:

h[l,r]=h[r]-h[l-1]*p[r-l+1];


解决实际问题

很久很久以前,森林里住着一群兔子。

有一天,兔子们想要研究自己的 DNA 序列。

我们首先选取一个好长好长的 DNA 序列(小兔子是外星生物,DNA 序列可能包含 26 个小写英文字母)。

然后我们每次选择两个区间,询问如果用两个区间里的 DNA 序列分别生产出来两只兔子,这两个兔子是否一模一样。

注意两个兔子一模一样只可能是他们的 DNA 序列一模一样。

输入格式

第一行输入一个 DNA 字符串 S。

第二行一个数字 m,表示 m 次询问。

接下来 m 行,每行四个数字l1,r1,l2,r2,分别表示此次询问的两个区间,注意字符串的位置从 1开始编号。

输出格式

对于每次询问,输出一行表示结果。

如果两只兔子完全相同输出 Yes,否则输出 No(注意大小写)。

数据范围

1≤length(S),m≤1000000

输入样例:

aabbaabb
3
1 3 5 7
1 3 6 8
1 2 1 2

输出样例:

Yes
No
Yes

 


题目分析:

该题目中对于小兔子的DNA序列为a-z的小写字母,可以将其映射到1-26,然后该问题就转换成了对于一段区间内小写字母的哈希值求解,当DNA序列相同时,也就是说指定这段区间内的字母对应的哈希值相同。


代码实现:

#include<iostream>
#include<string.h>
using namespace std;
typedef unsigned long long ull;
const int N =1000010,base =131;
char str[N];
ull h[N],p[N];

//返回指定区间的字符串对应的哈希值
ull get(int l,int r){
    return h[r]-h[l-1]*p[r-l+1];
}
int main(){
    scanf("%s",str+1);
    int n = strlen(str+1);//字符串长度从1开始 所以这里的长度n多加1
    p[0] = 1;
    for(int i=1;i<=n;i++){
        h[i] = h[i-1]*base + str[i]-'a'+1;
        p[i] = p[i-1]*base;
    }
    
    int m;
    cin>>m;
    while(m--){
        int l1,l2,r1,r2;
        scanf("%d%d%d%d",&l1,&r1,&l2,&r2);
        if(get(l1,r1)==get(l2,r2)) cout<<"Yes"<<endl;
        else cout<<"No"<<endl;
    }
    
    return 0;
}

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
字符串哈希算法是一种将字符串映射为数字的算法,常用于字符串的比较和匹配。在C++中,可以使用字符串哈希算法来加速字符串的比较操作。 引用\[1\]中的代码示例展示了一个使用字符串哈希算法的C++代码。该代码使用了前缀和数组和字符串数组来存储字符串,并通过计算哈希值来比较两个子串是否相等。其中,哈希值的计算使用了前缀和数组和幂运算。 引用\[2\]中的解释指出,使用字符串哈希的目的是为了比较字符串时不直接比较字符串本身,而是比较它们对应映射的数字。这样可以将子串的哈希值的时间复杂度降低到O(1),从而节省时间。 引用\[3\]中的代码示例也展示了一个使用字符串哈希算法的C++代码。该代码使用了前缀和数组和字符串数组来存储字符串,并通过计算哈希值来比较两个子串是否相等。与引用\[1\]中的代码类似,哈希值的计算也使用了前缀和数组和幂运算。 综上所述,字符串哈希算法是一种将字符串映射为数字的算法,常用于字符串的比较和匹配。在C++中,可以使用前缀和数组和幂运算来计算字符串哈希值,并通过比较哈希值来判断两个子串是否相等。 #### 引用[.reference_title] - *1* [C++算法题 # 33 字符串哈希](https://blog.csdn.net/weixin_44536804/article/details/123425533)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [字符串哈希(c++)](https://blog.csdn.net/qq_41829492/article/details/120980055)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [AcWing 841. 字符串哈希(C++算法)](https://blog.csdn.net/YSA__/article/details/108453403)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值