给定两个字符串S和T,在主串S中查找子串T的过程称为串匹配(string matching,也称模式匹配),T称为模式。这里将介绍处理串匹配问题的两种算法,BF算法和KMP算法。
BF算法
BF(Brute Force)算法是普通的模式匹配算法,BF算法的思想就是将目标串S的第一个字符与模式串T的第一个字符进行匹配,若相等,则继续比较S的第二个字符和 T的第二个字符;若不相等,则比较S的第二个字符和T的第一个字符,依次比较下去,直到得出最后的匹配结果。
代码如下:
int BF(char S[],char T[])
{
int index=0; //主串从下标0开始第一趟匹配
int i=0,j=0; //设置比较的起始下标
while((S[i]!='\0') && (T[j]!='\0'))
{
if(S[i]==T[j])
{
i++;
j++;
}else //i和j分别回溯
{
index++;
i=index;
j=0;
}
}
if(T[j]=='\0')
{
return index+1; //返回本趟匹配的开始位置
}else
{
return 0;
}
}
BF算法比较直接,是一种蛮力法,该算法最坏情况下要进行m*(n-m+1)次比较,时间复杂度为O(m*n),下面来看一个效率非常高的字符串匹配算法,即KMP算法。
KMP算法
KMP(Knuth-Morris-Pratt)算法的核心是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的。具体实现就是通过一个next()函数实现,函数本身包含了模式串的局部匹配信息。
代码如下:
void GetNext(char T[],int next[]) //求模式T的next值
{
int i,j,len;
next[0]=-1;
for(j=1;T[j]!='\0';j++