算法入门之KMP

KMP入门:

KMP算法是一种改进的字符串匹配算法,是D.E.Knuth与V.R.Pratt和J.H.Morris同时发现的算法。

比一般算法添加一个next[]数组。

next[]数组函数,通过子串自身匹配,找到指针的回溯,而主串不回溯的原理。使时间复杂度变为线性

查找。O(n+m);

next[j]的表达式为:1.next[j]=0;2.next[j]=-1;3.next[j]=max(k|0<k<j,且"t0t1...tk-1"="tj-ktj-k+1...tj-1";

由此为模:http://acm.hdu.edu.cn/showproblem.php?pid=1711

KMP算法技巧:

1.定义各个数组。

const int maxm=10010;
const int maxn=1000010;
int str[maxn];
int keyword[maxm];
int next[maxm];
int n,m;
2.构造next[]函数。

1).初值next[0]=-1;

2).若字符串匹配,或者k==-1.a.条件满足,进行3).否则将子段指向k=next[k].

next[k],即是前面字符的next[]值,表示是字段的回溯值。

3).当字符串不匹配时,next[j]=k;否则next[j]=next[k],表示的是:前面所出现

相同字符标号次数。

4).next[]值通过当前匹配推下个next[]值,并通过k的next[]值达到字段回溯,达到一种手段。

如{abcdaabcab}next[]值,优化前next={-1,0,0,0,0,1,1,2,3,1},优化后={-1,0,0,0,-1,1,0,0,3,0}。

void get_next()
{
    int j,k;
    j=0;
    k=-1;
    next[0]=-1;
    while(j<m)
    {
        if(k==-1||keyword[j]==keyword[k])
		{
           j++;
		   k++;
		   if(keyword[j]!=keyword[k])
             next[j]=k;
		   else
			   next[j]=next[k];
        }
        else
			k=next[k];
    }    
} 

3.KMP算法,运用next[].不断字段回溯找相同字串。

int KMP_index()
{
    int i=0,j=0;
	int p;
    get_next();
    while(i<n&&j<m)
    {
        if(j==-1||str[i]==keyword[j])
        {
            i++;
            j++;
        }    
        else
			j=next[j];
        
    }    
    if(j>=m) 
		p=i-m+1;
    else 
		p=-1;
	return p;
}      
5.函数main()。

int main()
{
    int i,j,T;
    scanf("%d",&T);
    while(T--)
    {
        scanf("%d%d",&n,&m);
        for(i=0;i<n;i++)
          scanf("%d",&str[i]);
        for(i=0;i<m;i++)
          scanf("%d",&keyword[i]);
        printf("%d\n",KMP_index());
    }    
    return 0;
}    
6.总结。KMP入门,理解不是很好。


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值