字符串哈希

概念

将字符串通过哈希函数转换为唯一的哈希值,可以减少内存占用,降低时间复杂度。问题时不同的字符串可能会得到相同的哈希值,也就是发生了哈希碰撞,因此哈希算法的难点就是就是如何来构造一个哈希函数,尽可能的避免哈希碰撞,以满足我们的使用需求。

基本哈希方法

给定字符串 S = s 1 s 2 s 3 s 4 . . . S=s_1s_2s_3s_4... S=s1s2s3s4... i d x ( x ) = x − ′ a ′ + 1 idx(x)=x-'a'+1 idx(x)=xa+1, 或者直接使用x的ASCII码也行

自然溢出法

这种方法是利用数据结构unsigned long long的范围自然溢出:即当存储的数据大于unsigned long long的存储范围时,会自动mod 264−1264−1,就不用mod其他质数来保证唯一性了。

unsigned long long Hash[n]
hash[i]=hash[i−1]∗p+idx(s[i]);

这里的p一定要是个质数,不然可能无法保证唯一性。

单哈希法

相当于自然溢出法没有了自动取模的操作,所以需要自己进行取模操作。但是这种Hash方法在模数较小的时候的稳定性不一定得到保证,所以在这个方面不如其他方法。

hash[i]=(hash[i−1])∗p+idx(s[i])%mod;

这里的p和mod都是质数,且满足p<mod。最好在选取的时候把p和mod的值取大一点。

双哈希法

双Hash就是对一个hash值用两个不同的质数进行两次modmod操作,然后最后用一对数<hash1[n],hash2[n]><hash1[n],hash2[n]>来表示一个字符串的哈希值,这样的一对数的重复几率加上选择较大的质数,冲突率几乎为0。

hash1[i]=(hash1[i−1])∗p+idx(s[i]) % mod1
hash2[i]=(hash2[i−1])∗p+idx(s[i]) % mod2

计算子串的哈希值

如果我们求出一个串的Hash,就可以O(1)求解其子串的Hash值。

若已知一个 ∣ S ∣ = n |S|=n S=n的字符的hash值, h a s h [ i ] , 0 < = i < = n hash[i], 0<=i<=n hash[i],0<=i<=n 子串为 S [ l : r ] , 1 < = l < = r < = n S[l:r], 1 <= l <= r <= n S[l:r],1<=l<=r<=n对应的hash值为:

h a s h = ( ( h a s h [ r ] − h a s h [ l − 1 ] ∗ p r − l + 1 ) hash=((hash[r]-hash[l-1]*p^{r-l+1})%mod + mod)%mod hash=((hash[r]hash[l1]prl+1)

参考

【基本算法入门-字符串哈希(Hash)】-C++ - 摸鱼酱 - 博客园

【字符串哈希】字符串哈希入门

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
字符串哈希算法是一种将字符串映射为数字的算法,常用于字符串的比较和匹配。在C++中,可以使用字符串哈希算法来加速字符串的比较操作。 引用\[1\]中的代码示例展示了一个使用字符串哈希算法的C++代码。该代码使用了前缀和数组和字符串数组来存储字符串,并通过计算哈希值来比较两个子串是否相等。其中,哈希值的计算使用了前缀和数组和幂运算。 引用\[2\]中的解释指出,使用字符串哈希的目的是为了比较字符串时不直接比较字符串本身,而是比较它们对应映射的数字。这样可以将子串的哈希值的时间复杂度降低到O(1),从而节省时间。 引用\[3\]中的代码示例也展示了一个使用字符串哈希算法的C++代码。该代码使用了前缀和数组和字符串数组来存储字符串,并通过计算哈希值来比较两个子串是否相等。与引用\[1\]中的代码类似,哈希值的计算也使用了前缀和数组和幂运算。 综上所述,字符串哈希算法是一种将字符串映射为数字的算法,常用于字符串的比较和匹配。在C++中,可以使用前缀和数组和幂运算来计算字符串哈希值,并通过比较哈希值来判断两个子串是否相等。 #### 引用[.reference_title] - *1* [C++算法题 # 33 字符串哈希](https://blog.csdn.net/weixin_44536804/article/details/123425533)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [字符串哈希(c++)](https://blog.csdn.net/qq_41829492/article/details/120980055)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [AcWing 841. 字符串哈希(C++算法)](https://blog.csdn.net/YSA__/article/details/108453403)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值