背景
到什么是字符串哈希(Hash)?很多人都会疑惑,我们可以这么理解,定义一个把字符串映射到整数的函数 f,这个 f 称为是Hash函数。而我们希望这个函数 f 可以方便地帮我们判断两个字符串是否相等。
代码
int strHash(String ss, String b) {
//进制 PPP 常用的值有31、131、1313、13131、131313等,用这些数值能有效避免碰撞。
int P = 131;
int n = ss.length(), m = b.length();
String str = ss + b;
int len = str.length();
//h【i】的意义就是求区间【0~i】的字符串的哈希值
//p【i】 是记录第i位字符的乘以P的次数-权值
int[] h = new int[len + 10], p = new int[len + 10];
p[0] = 1;
//通过前缀和 h(i) 记录hash值,方便计算
for (int i = 0; i < len; i++) {
p[i + 1] = p[i] * P;
h[i + 1] = h[i] * P + str.charAt(i);
}
int r = len, l = r - m + 1;
// h[i]=h[i-1] * P + str.charAt(i);
// h[i+1]=h[i-1] * P^2 + str.charAt(i) * P +str.charAt(i + 1)
// h[i+2]=h[i-1] * P^3 + str.charAt(i) * P^2 +str.charAt(i + 1) * P + str.charAt(i + 2)
//推论 - 相当于对字符串求hash值
//h[r] - h[l - 1] * p[r - l + 1] = str.charAt(l - 1) * P ^ (r-l) + str.charAt(l) * P ^ r +....+ str.charAt(r);
int target = h[r] - h[l - 1] * p[r - l + 1]; // b 的哈希值
//通过右移一位,减少边界条件0的判断
for (int i = 1; i <= n; i++) {
int j = i + m - 1;
int cur = h[j] - h[i - 1] * p[j - i + 1]; // 子串哈希值
//返回满足条件的开始位置 - 在a+b字符串中的位置
if (cur == target) return i - 1;
}
//没有找到
return -1;
}
参考文档
https://www.dotcpp.com/course/964 (解析字符串哈希(Hash))