哈希算法

哈希算法

两个字符串,例如其中一个字符串为aabbaabb,想要确认另一个字符串是否和其完全一样或者在其中是否有相同的字符串,那就需要一个一个的去比,其时间的复杂度为O(n),往往在解决一些题目时,时间度上是不行滴,所以我们就有了哈希算法。
用法:可以通俗的理解为,把一个字符串转换为一个整数。
例如:一个字符串abcabcdefg,怎样计算其哈希值。在这里插入图片描述
解释:假设其为26进制,其哈希值计算步骤就为如图所示,后面是其取模,一般q取131和1331,因为其重复出现的概率很小。
在代码中哈希的公式为hash[i]=(hash[i−1])∗p+idx(s[i]) % mod,其中idx(x)=x−′a′+1idx(x)=x−′a′+1,怎样解释呢。
第二,假设要求一个字符串里面的一部分的哈希值,就如这种问题:给两个字符串S1,S2,求S2是否是S1的子串,并求S2在S1中出现的次数,此时就有第二个公式了。
在这里插入图片描述

考虑到hash[i]每次对p取模,进一步得到下面的式子:
hash=(hash[r]−hash[l−1]∗pr−l+1)%MOD。
例题
很久很久以前,森林里住着一群兔子。有一天,兔子们想要研究自己的 DNA 序列。我们首先选取一个好长好长的 DNA 序列(小兔子是外星生物,DNA 序列可能包含 26 个小写英文字母)。然后我们每次选择两个区间,询问如果用两个区间里的 DNA 序列分别生产出来两只兔子,这两个兔子是否一模一样。注意两个兔子一模一样只可能是他们的 DNA 序列一模一样。
输入格式
第一行输入一个 DNA 字符串 S。第二行一个数字 m,表示 m 次询问。接下来 m 行,每行四个数字 l1,r1,l2,r2l1,r1,l2,r2,分别表示此次询问的两个区间,注意字符串的位置从1开始编号。
输出格式
对于每次询问,输出一行表示结果。如果两只兔子完全相同输出 Yes,否则输出 No(注意大小写)。
数据范围
1≤length(S),m≤10000001≤length(S),m≤1000000
输入样例:
aabbaabb
3
1 3 5 7
1 3 6 8
1 2 1 2
输出样例:
Yes
No
Yes
思路:这题的思路其实就和上面的第二种方法一样,就是判断一个字符串中的其中两个子字符是否完全相等,如果相等就输出Yes,否则就输出No。

    p[0]=1;
    for(int i=1;i<=len;i++)
    {
        h[i]=h[i-1]*base+str[i]-'a'+1;//计算前缀hash的值
        p[i]=p[i-1]*base;//第i的进制p的位值
    }

函数:

ULL get(int l,int r)
{
    return h[r]-h[l-1]*p[r-l+1];
}

进去一个l和r,计算片段的hash值。
这题的关键步骤就在这两块,其实这种算法完全可以去取代KMP,而且还比KMP更容易记住一点。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值