BF匹配算法
- 定义一个字符串类,将输入的数组存储在ch[MAXLEN + 1]中,第0位不存储元素,便于之后算法的实现
class Sstring
{
public:
char ch[MAXLEN + 1];
int length;
Sstring(const char* str):length(strlen(str))
{
for (int i = 1; i <= length;i++)
{
ch[i] = *str;
str++;
}
}
};
- BF字符串匹配算法
1.循环结束标志:长串、短串都遍历到最后一个元素(遍历了所有元素)
2.根据短串的下标判断是否匹配成功,如果最后没有回溯到1就是匹配成功,回溯到1则匹配失败
回溯位置的计算:
j 起 始 位 置 + j 移 动 步 数 = j 当 前 位 置 j起始位置+j移动步数 = j当前位置 j起始位置+j移动步数=j当前位置
j 移 动 步 数 = i − 1 j移动步数 = i-1 j移动步数=i−1
j 起 始 位 置 = j 当 前 位 置 − j 移 动 步 数 = j − ( i − 1 ) j起始位置 = j当前位置-j移动步数 = j - (i-1) j起始位置=j当前位置−j移动步数=j−(i−1)
j 回 溯 位 置 = j 起 始 位 置 + 1 = j − i + 2 j回溯位置 = j起始位置+1 = j-i+2 j回溯位置=j起始位置+1=j−i+2
i 回 溯 位 置 = 1 i回溯位置 = 1 i回溯位置=1
int index_BF(Sstring slong, Sstring sshort)
{
int i = 1,j = 1;
while (i <= sshort.length&&j <= slong.length) {
if (sshort.ch[i] == slong.ch[j]) {
i++;
j++;
}
else
{
j = j - i + 2;//回溯:j = j-(i-1)+1
i = 1;
}
}
if (i >= sshort.length) return (j - sshort.length);
else return 0;
}
KMP匹配算法
KMP算法是对BF算法的改进,匹配的过程如下图,对于主串的每一个元素都会逐一匹配,匹配失败时,下一次将从匹配失败位置接着匹配,而子串的匹配起始位置则是根据next[ ]数组得到。
我们假设第
j
j
j位元素匹配失败时,下一次匹配起始位置位next[
j
j
j]
int index_KMP(Sstring slong, Sstring sshort)
{
int i = 1,j = 1;
while (i <= sshort.length&&j <= slong.length) {
if (sshort.ch[i] == slong.ch[j]) {
i++;
j++;
}
else
{
i = next[i];
}
}
if (i >= sshort.length) return (j - sshort.length);
else return 0;
}
算法核心在于,找到下一次模式串的起始匹配位置。
n
e
x
t
[
j
]
=
{
0
,
j
=
1
1
,
首
尾
重
合
数
为
0
m
a
x
(
k
)
,
首
尾
重
合
数
为
k
−
1
next[j]=\left\{ \begin{matrix} 0 ,j=1\\ 1 ,首尾重合数为0\\ max(k),首尾重合数为k-1 \end{matrix} \right.
next[j]=⎩⎨⎧0,j=11,首尾重合数为0max(k),首尾重合数为k−1
- next算法代码实现
没学会…好难。。。