字符串匹配问题

字符串匹配问题

KMP算法

KMP算法通常需要一个部分匹配表(Partial Match Table)。用next数组保存部分匹配值,也就是前 i 个字符所组成的子串的真前缀与真后缀相同的最大长度。当发生不匹配时,直接从next数组保存的索引开始匹配,忽略不必要的匹配操作。

真前缀

真前缀,指字符串首部开始的除了最后一个字符的所有子串。
例如"abcde"的真前缀有[a,ab,abc,abcd]

真后缀

真后缀,指字符串尾部开始的除了第一个字符的所有子串。
例如"abcde"的真后缀有[bcde,cde,de,e]

真前缀与真后缀相同的最大长度

例如"ababa"的真前缀为[a,ab,aba,abab],真后缀为[baba,aba,ba,a],其中相同的最长子串为"aba" 即最大长度为3。

next表格:

ABABCABAA
-101201231

求next表格的相关代码:

  1. 求其前缀表(
void next_table(char pattern[],int next[],int n){
	next[0] = 0;
	int l = 0;
	int i = 1;

	while(i<n){
		if(pattern[i] == pattern[l]){
			l ++;
			next[i] = l;
			i ++;
		}
		else{
			if(l > 0){
				l = next[l-1];
			}
			else{
				next[i] = l;
				i++;
			}
		}
	}	
	//cout << "nnn";
	return;
}

2.后移一位

void move(int next[],int n){
	int i;
	for(i = n-1;i>0;i--){
		next[i] = next[i-1];
	}
	next[0] = -1;
}

KMP查找代码:

void kmp(char text[],char pattern[]){
	int n = strlen(pattern);
	int m = strlen(text);
	int next[N];
	next_table(pattern,next,n);
	move(next,n);
	int i=0;
	int j=0;
//	for(int i=0;i<n;i++){
//		cout << next[i] << "  ";
//	} 
	while(i<m){
		//cout <<i << "-----" <<m <<"---"<< j<<endl;
		if(j==n-1&&text[i]==pattern[j]){
			printf("found pattern at %d\n",i-j);
			j = next[j];
			break;
		}
		if(text[i]==pattern[j]){
			i++;
			j++;
		}
		else{
			j = next[j];
			if(j==-1){
				i++;j++;
			}
		}
	}
	return;
}

洛谷例题:
P3375
P4391(主要对next数组的理解)

BM算法

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值