在准备一些实习笔试时,发现编程题的重点都落在了字符串上,题目各异,但却着重考察了对字符串的掌握程度。故专门复习了字符串匹配算法。
在字符串的匹配算法中,最好理解的就是朴素匹配算法,即通过字符串1和字符串2点对点式的暴力匹配,得到匹配结果。还有一种是KMP模式匹配算法,它分析了朴素匹配算法中不必要的匹配情况,更好的为匹配节省了时间。
1.朴素匹配算法
其匹配过程如下图所示,非常清晰明了。从src的第一个字符和dst的第一个字符串比较,一旦出现不匹配,则从src的第二个字符串开始比较,如2,直到匹配上所有,如5。
程序代码如下:注(所有的位置起始为0,所以当标记为第7位时,是从0开始的第7位)
int BoliPiPei(string src, string dst)
{
int len = src.size();
int len2 = dst.size();
int i = 0;
for (; i < (len - len2 + 1); ++i)
{
int j = 0;
for (; j < len2; ++j)
{
if (src[i + j] != dst[j])
break;
}
if (j == len2)
return (i );
}
return -1;
}
int main()
{
string src("goodglesifsalesifa");
string dst("lesifa");
int pos=BoliPiPei(src, dst);
cout << src << endl;
cout << dst << endl;
cout << pos;
return 0;
}
2.KMP匹配算法
KMP匹配算法的核心是next数组。也就是说我们为要匹配的字符串dst找到其对应的next数组,那么我们就可以省去大量的无效匹配动作。
next数组的作用:在朴素匹配失败时,被匹配的主串src后向后挪动一个元素,匹配的子串dst会回到起始位置重新新的一轮的匹配。而dst拥有next数组后,我们就不需要每次将子串回到起始位置,而是回到子串当前j所对应的next[j]所指的位置。
如何得到next数组:next[0]=0,next[1]=1;这个是确定的规律。next[i]的值由dst的【0,i-1】的子串确定。举例如下:
![](https://i-blog.csdnimg.cn/blog_migrate/7bec705af1f988304619660d1ae35075.jpeg)
next[i]值一般规律如下:如果其子串前后缀一个字符相等,k值为2,两个字符相等,k值为3,n个字符相等,k值为n+1。
代码如下:
int Next(char* ss)//求取当前字串的next[i]的值
{
int len = strlen(ss);
int i = 0;
for (; i < len-1; ++i)
{
if (ss[i] != ss[len - 1 - i])
break;
}
if (i == 0)
return 1;
return i;
}
void getnext(string str,int *next)//获取当前整个字符串的next数组
{
next[0] = 0;
next[1] = 1;
int len = str.size();//获得当前字符串的next数组
for (int i = 1; i < len; ++i)
{
char ss[50];
basic_string<char>::pointer itss = ss;
int len=str.copy(itss, (i+1));//首先将str中的前i个元素拷贝给ss
next[i+1] = Next(ss);//下一个数组值是当前字串计算值
}
}
int PuSuPiPei(string src, string dst)
{
int len1 = src.size();
int len2 = dst.size();
int i = 0, j = 0;
int next[255];
getnext(dst, next);
for (; i < (len1 - len2 + 1); ++i)
{
for (; j < len2; ++j)
{
if (src[i + j] != dst[j])
{
j = next[j];//将j退回到next[j]所指位置
break;
}
}
if (j == len2)
{
return i;
}
}
return -1;
}
int main()
{
string ss("abcabx");
string st("abx");
int pos = PuSuPiPei(ss, st);
cout << ss << endl;
cout << st << endl;
cout << pos;
return 0;
}