首先说明这个总结是给自己回顾用的。
1.原始的暴力匹配
public static int SubString(String s, int pos, String subString) {
//s 原字符串
//pos 查找的起始位置
//subString 查找的子字符串
//当查找到第一个匹配的子串的时候,返回第一个字符在原字符串中的
//位置
int i = pos, j = 0;
//当两个坐标都不超过各自串的长度的时候进行循环遍历
//若原字符串到头了,或者是子字符串到头了,则出循环
while (i < s.length() && j < subString.length()) {
if (s.charAt(i) == subString.charAt(j)) {
//如果字符相同,位置各加一
i++;
j++;
} else {
//如果字符不相同,则原字符串进行回溯操作,子字符串进行位置置零
if (j == 0)
i++;
else {
i = i - j + 1;
j = 0;
}
}
}
//检查子字符串的标志长度
//若等于子字符串的长度则说明找到了匹配的位置
//若小于子字符串的长度则说明没找到匹配的位置
if (j == subString.length())
return i - j;
return -1;
}
2.改进的模式匹配算法
改进后的模式匹配算法,可以不用每次都让主串回退到最开始的位置再加一了。
此时增加了一个next数组用来记录模式串的信息。
next[i] 表示模式串中p[0]…p[i]中能够发现的前缀和后缀相同的最大长度。
next数组的实现方式如下:
而后用这个数组实现KMP算法:
遇见不匹配的情况,主串不用动,直接将子串指针位置
pos = next[pos-1],前面的都是相同的,直接从此处比较就行了。
3.改进next数组的求法
求解next数组的时候,不需要像2中那么麻烦。
我们考虑采用递推的方式求出next数组。如果next[0], next[1], … next[x-1]均已知,那么如何求出 next[x] 呢?
分情况讨论。
首先,已经知道了 next[x-1](以下记为now),如果 P[x] 与 P[now] 一样,那最长相等前后缀的长度就可以扩展一位,则 next[x] = now + 1
如果P[x] 与 P[now] 不一样,就令now = next[now-1]
而后比较一个小的前面和后面是否一样
now如果变小了,则要从变小的地方重新加上来,这是一个规律