哔哩哔哩 视频讲解:https://www.bilibili.com/video/BV1Wb4y1K7va/
import java.util.Scanner;
public class StrHash {
static char[] s1, s2; // s1是主串,s2是子串。在s1中找有几个子串跟 s2是相似的
public static void main(String[] args) {
Scanner sc = new Scanner(System.in);
int n = sc.nextInt(); // 测试的组数
while (n-- > 0) {
s1 = sc.next().toCharArray();
s2 = sc.next().toCharArray();
N = s1.length;
M = s2.length;
System.out.println(solve());
}
}
private static int solve() {
// 1、先对s1、s2计算哈希值
init();
// 2、枚举 s1字符串中 长度=M的子串,看看这个子串是否 跟s2 是相似的
int ans = 0;
for (int l = 0, r = M - 1; r < N; l++, r++) { // 枚举左边界
if (check(l, r, l) <= 3){
ans++;
}
}
return ans;
}
// l, r 就是指向s1串的左右边界
// check函数就是判断 s1[l ... r]的子串 跟 s2串,有几个字符是不一样的
// 整体进行二分查找,超过 3个字符不一样了,就提前返回了
private static int check(int l, int r, int offset) {
if (l == r) return s1[l] == s2[l - offset] ? 0 : 1;
int mid = (l + r) / 2;
int cnt = 0;
if (getValueOfS1(l, mid) != getValueOfS2(l - offset, mid - offset)) {
cnt += check(l, mid, offset);
}
if (cnt > 3) return cnt;
if (getValueOfS1(mid + 1, r) != getValueOfS2(mid + 1 - offset, r - offset)) {
cnt += check(mid + 1, r, offset);
}
return cnt;
}
// 以下都是 字符串哈希的模板
static int P = 131, N, M; //P取131,用于哈希的指标。 s1的长度、s2的长度
static int MAXN = 100001; // s1 s2 字符串的最大长度
static long[] preSum1 = new long[MAXN]; // s1字符串的前缀和数组,左闭右开区间
static long[] preSum2 = new long[MAXN]; // s2字符串的前缀和数组,左闭右开区间
static long[] p = new long[MAXN]; // p[i] = p ^ i
// 统一计算s1 s2的哈希值
private static void init() {
p[0] = 1; // p^0 = 1
preSum1[0] = preSum2[0] = 0; // 0下标的位置留出来不用
// 1、计算s1的哈希值的前缀和
for (int i = 0; i < N; i++) {
p[i + 1] = p[i] * P; // 先计算 权重
preSum1[i + 1] = preSum1[i] * P + s1[i]; // 计算累加和
}
// 2、再计算s2的哈希值的累加和
for (int i = 0; i < M; i++) {
p[i + 1] = p[i] * P;
preSum2[i + 1] = preSum2[i] * P + s2[i];
}
}
// 返回s1字符串 [l, r]范围的哈希值
private static long getValueOfS1(int l, int r) {
return preSum1[r + 1] - preSum1[l] * p[r - l + 1];
}
// 返回s2字符串 [l, r]范围的哈希值
private static long getValueOfS2(int l, int r) {
return preSum2[r + 1] - preSum2[l] * p[r - l + 1];
}
}