KMP算法

最新推荐文章于 2024-07-24 22:51:50 发布

kiu000

最新推荐文章于 2024-07-24 22:51:50 发布

阅读量591

点赞数

分类专栏：算法文章标签：算法 KMP

本文链接：https://blog.csdn.net/kiu000/article/details/8819354

版权

6 篇文章 0 订阅

订阅专栏

KMP算法由Knuth、Morris和Pratt同时提出线性时间匹配字符串的算法，其时间复杂度为O(n+m)，其中n为被匹配字符串T长度，m为模式字符串P长度。

朴素字符串匹配算法时间复杂度为O((n-m+1)*m)，不需要预处理时间，KMP算法利用在匹配过程中得到的信息可以避免不必要的比较，从而降低时间复杂度，但需要预处理模式字符串，其中预处理时间复杂度为O(m)，匹配时间复杂度为O(n)。

KMP算法分为两个步骤：

第一步，预处理模式字符串，根据模式字符串计算出其前缀函数f ，f是从集合{1，2，......，m}到集合{0，1，......，m-1}的映射。f(q)=max{k：Pk是Pq的前缀且k<q}（Pk是模式字符串P前k字符的子串，Pq是模式字符串P前q个字符的子串）。

易知q为1时，f[1]=0；而当 q>1 时f[q]通过f[q-1]可以计算得到，若P[f*[q-1]+1] = P[q] （其中f*[q]是前缀函数的迭代，f''[q]=f[f[q]]，*是满足此式的最小值），

则f[q]=f*(q-1)+1。预处理时间复杂度为O(m)：

f[1]=0;

k=0;

for(q=2;q<=m;++q)

{

	while(k>0&&P[k+1]!=P[q])

		k=f[k];

	if(P[k+1]==P[q])

		k = k+1;

	f[q] = k;

}

第二步：根据前缀函数f来匹配字符串，其过程实质是一个有限自动机状态转移，根据即将输入的字符和前缀函数组合可以得到状态转移函数。这个步骤时间复杂度为O(n)：

k=0; //k为已匹配模式字符串的前缀函数的值
for(i=1;i<=n;++i)
{
	while(k>0&&P[k]!=T[i])
		k=f(k);
	if(P[k]==T[i])
		k = k+1;
	if(k==m)
		Printf(match!);
		k=f(k); 

}

关注

专栏目录