1.简单匹配算法(暴力法)
算法思想直截了当,将文本串S中从某个位置i起与模式串T相比较,从 j=0 起比较 S[i+j] 与 T[j],如果相等继续向后比较(j+1)如果不相等,模式串回溯至开始处(j=0)文本串从当前的位置的下一个位置进行匹配(i+1)。
算法函数如下:
void GeneralMatch(const char ssrc[],const char sdst[], int &index)
{
int i = 0;
int j = 0;
while(ssrc[i + j] != '\0' && sdst[j] != '\0')
{
if (ssrc[i + j] == sdst[j])
{
j ++;
}
else
{
i ++;
j = 0;
}
}
if(sdst[j] == '\0')
{
index = i;
}
else
{
index = -1;
}
}
算法图解:
2.KMP匹配算法
与一般匹配算法有所不同的是,KMP算法在匹配失败时,不回溯文本串(主串),而是滑动模式串进行匹配,提高算法效率。
算法图解:
问题是发生匹配失败时,如何计算模式串的滑动位置,根据模式串本身计算(与主串无关),即模式值next[n],定义为:
(1) next[0]= -1 意义:任何串的第一个字符的模式值规定为-1。
(2) next[j]= -1 意义:模式串T中下标为j的字符,如果与首字符相同,且j的前面的k-1个字符与开头的k-1个字符不等(或者相等但T[k]==T[j])(1≤k)。
如:T=”abCabCad” 则 next[6]=-1,因T[3]=T[6]
(3) next[j]=k 意义:模式串T中下标为j的字符,如果j的前面k个字符与开头的k个字符相等,且T[j] != T[k] (1≤k)。即T[0]T[1]T[2]。。。T[k-1]==
T[j-k]T[j-k+1]T[j-k+2]…T[j-1]且T[j] != T[k].(1≤k);
(4) next[j]=0 意义:除(1)(2)(3)的其他情况。
void getNext(const char* pattern,int next[])
{
next[0]= -1;
int k=-1,j=0;
while(pattern[j] != '/0')
{
if(k!= -1 && pattern[k]!= pattern[j] )
k=next[k];
++j;++k;
if(pattern[k]== pattern[j])
next[j]=next[k];
else
next[j]=k;
}
}