BF算法简介:
BF算法,即暴力(Brute Force)算法,是普通的模式匹配算法,BF算法的思想就是将目标串S的第一个字符与模式串T的第一个字符进行匹配,若相等,则继续比较S的第二个字符和 T的第二个字符;若不相等,则比较S的第二个字符和T的第一个字符,依次比较下去,直到得出最后的匹配结果。BF算法是一种蛮力算法。
KMP算法简介:
KMP算法是一种改进的字符串匹配算法,由D.E.Knuth,J.H.Morris和V.R.Pratt提出的,因此人们称它为克努特—莫里斯—普拉特操作(简称KMP算法)。KMP算法的核心是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的。具体实现就是通过一个next()数组实现,函数本身包含了模式串的局部匹配信息。KMP算法的时间复杂度为O(m+n) 。
KMP算法是对BF算法的改进,主要是减少了不必要的回溯,以达到减少时间复杂度的目的。
next数组的生成方式一两句解释不清,如有需要的请自行百度,这里只是发一下实现KMP算法的具体代码。
具体代码(C语言):
#include <stdio.h>
#include <string.h>
typedef struct Array
{
int cnt;
char *S;
} Array;
void kmp(Array *array, Array *target, int *next)
{
int i, j;
i = j = 1;
while (i <= target->cnt && j <= array->cnt)
{
if (target->S[i] == array->S[j])
{
if (j == array->cnt)
{
printf(">>匹配成功!\n");
return;
}
i++;
j++;
}
else
{
j = next[j];
if (0 == j)
{
j++;
i++;
}
}
}
printf(">>匹配失败!\n");
}
void getIndex(Array *array, int *next)
{
int i = 1, j = 0;
while (i <= array->cnt)
{
if ( 0==j || array->S[i] == array->S[j])
{
i++;
j++;
if (array->S[i] != array->S[j])
{
next[i] = j;
}
else
{
next[i] = next[j];
}
}
else
{
j = next[j];
}
}
}
int main(void)
{
Array array, target;
int next[255];
char s[255];
char input;
int i = 0;
target.S = " ababaaababaa"; // 因为都是从下标1开始匹配的,所以前边加一个空字符。
target.cnt = strlen(target.S)-1;
printf(">>目标字串:%s\n", target.S);
printf(">>输入一段字串(以#结尾):");
input = ' ';
do
{
s[i] = input;
scanf("%c", &input);
if (input == '#')
{
break;
}
i++;
} while (1);
array.S = s;
array.cnt = i;
getIndex(&array, next);
kmp(&array, &target, next);
return 0;
}
运行结果:
示例1.
>>目标字串: ababaaababaa
>>输入一段字串(以#结尾):babaa#
>>匹配成功!
示例2.
>>目标字串: abaacde
>>输入一段字串(以#结尾):bcde#
>>匹配失败!