title: 串的模式匹配算法之kmp
date: 2018-10-14 10:39:19
tags: 数据结构与算法之美
author: 辰砂tj
1.引言
首先我们需要了解串的模式算法目的:确定主串中所含子串第一次出现的位置(定位);常见的算法种类:
BF算法(又称古典的、经典的、朴素的、穷举的),KMP算法(特点:速度快)。网上有很多帖子,博客写的都特别好,这篇文章也是对自己的一个总结。
2.BF算法
BF算法设计思想:
将主串的第pos个字符和模式的第一个字符比较
若相等,继续逐个比较后续字符;
若不等,从主串的下一字符起,重新与模式的第一个字符比较。
直到主串的一个连续子串字符序列与模式相等 。
返回值为S中与T匹配的子序列第一个字符的序号,即匹配成功。
否则,匹配失败,返回值 0
1.举例:
假设现在我们面临这样一个问题:有一个文本串S,和一个模式串P,现在要查找P在S中的位置,怎么查找呢?
如果用暴力匹配的思路,并假设现在文本串S匹配到 i 位置,模式串P匹配到 j 位置,则有:
如果当前字符匹配成功(即S[i] == P[j]),则i++,j++,继续匹配下一个字符;
如果失配(即S[i]! = P[j]),令i = i - (j - 1) (表示主串的位置回到当前的下一个位置),j = 0。相当于每次匹配失败时,i 回溯,j 被置为0。
public static int bfMatch(char[] s, char[] p) {
int sLen = s.length;
int pLen = p.length;
int i = 0;
int j = 0;
while (i < sLen && j < pLen) {
if (s[i] == p[j]) {
//①如果当前字符匹配成功(即S[i] == P[j]),则i++,j++
i++;
j++;
} else {
//②如果失配(即S[i]! = P[j]),令i = i - (j - 1),j = 0
// i - (j - 1) 表示主串的位置回到当前的下一个位置。
i = i - j + 1;
j = 0;
}
}
//匹配成功,返回模式串p在文本串s中的位置,否则返回-1