一. 模板
核心思想:将字符串看成P进制数,P的经验值是131或13331,取这两个值的冲突概率低
小技巧:取模的数用2^64,这样直接用unsigned long long存储,溢出的结果就是取模的结果
typedef unsigned long long ULL;
ULL h[N], p[N]; // h[k]存储字符串前k个字母的哈希值, p[k]存储 P^k mod 2^64
// 初始化
p[0] = 1;
for (int i = 1; i <= n; i ++ )
{
h[i] = h[i - 1] * P + str[i];
p[i] = p[i - 1] * P;
}
// 计算子串 str[l ~ r] 的哈希值
ULL get(int l, int r)
{
return h[r] - h[l - 1] * p[r - l + 1];
}
二. 总结
- 对比 KMP:KMP能做循环节,其余一般都能用字符串hash替代KMP
- 字符串的前缀哈希法
三. 例题
AC代码:
#include <iostream>
using namespace std;
const int N = 1e5 + 10, P = 131; // P为将字符串映射的进制数,取131或13331能够减少hash冲突
typedef unsigned long long ULL;
ULL h[N], p[N]; // h[N] 代表每个前缀字符串hash的值,p[N]代表每个字符串的相应的进制积
char s[N]; // 读取的字符串
// 获取[l, r]的字符串哈希值
int get(int l , int r)
{
return h[r] - h[l - 1] * p[r - l + 1]; // 范围内的哈希 = 最高位哈希 - 最低位下一位哈希 * 对应的进制积 :
// 34 = 1234 - 12 * 10^2
}
int main()
{
int n, m;
cin >> n >> m;
p[0] = 1; // 初始化进制的幂
for (int i = 1; i <= n; ++i) {
cin >> s[i];
p[i] = p[i - 1] * P; // p[i] 表示 p 的 i 次幂
h[i] = h[i - 1] * P + s[i]; // 不能将字符映射为0,否则在数值上00 = 0
}
while (m -- )
{
int l1, r1, l2, r2;
scanf("%d%d%d%d", &l1, &r1, &l2, &r2);
if (get(l1, r1) == get(l2, r2)) puts("Yes");
else puts("No");
}
return 0;
}