KMP算法实现(无缩进,基于C)

1.串数据存储

	使用string字符串进行数据存储,串头不需要计数字符总数,也就是不需要将所有字符后退一位。

2.匹配方式

	设现字符S1=“s1,s2,s3....sn”为主串,S2="s1,s2,s3....sm"为匹配串,将S2串成为模式串,再S1中寻找完全等于S2的子串。NEXT数组存储
S2每一个元素失配时,可以可以让S1从字符串首回溯的个数。(默认各位理解next数组含义)
void getnext(string s,int next[]) {
	int len = s.size(); //len计算s的最大长度
	if (len >= 1)
		next[0] = 1; //预先S2第一个元素的回溯个数为1,因为显而易见的自己和自己匹配时,不可能从第一个开始
	if (len >= 2)
		next[1] = 1;//设置第二个元素回溯个数为1,因为不论S[2]是否等于S[1],作为一个开始匹配的字符回溯个数只能为1
	int i = 1, j = 1;//初始化index,i为主串当前匹配字符,j为模式串当前字符。 i初始化1是由于从第二个字符开始匹配,
	//而模式串当前字符串为j-1,j=1是因为所以next值均大于等于1。假设next[0]=0,j=0,而当串不匹配时j只能回溯为next[j]
	//的值,那么匹配串将卡死再 j(1)=next[j(1)],因此做出如下优。
	while (i < len) {
		if (s[i] == s[j - 1]) {//字符串匹配时,同时向后移动一个,并且设置next值
			i++;
			j++;
			next[i] = j;//简化写next[++i] = ++j;为了易度分开来写
		}
		else if (j == 1) {//回溯推出点,当j==1时,说明当前字符无法匹配任何一个字符,设置为1,主串指向下一个
			i++;
			next[i] = 1;
			
		}
		else j = next[j];//向前回溯,寻找当前值可能相同的回溯点
	}
}
int KMP(string s1, string s2, int next[]) {
	int i = 0, j = 0;//s1,s2从首位开始匹配
	while (i < s1.size() && j < s2.size()) {//如果s1匹配完,或者s2匹配完成,退出while
		if (s1[i] == s2[j]) {//如果相等,同时向后
			i++;
			j++;
		}
		else if (j == 0) {//当回溯到第一个都无法相等时,主串向后,j不动,因为已经再第一个了
			i++;
		}
		else {
			j = next[j] - 1;//得到的可以回溯的值比index多了1,即可以回溯5个,再数组中为s2[4];
		}
	}
	if (j == s2.size())//如果退出while时j指向最后一个(因为最后一个相等时,还执行了一次j++操作,所以比index大一),说明匹配成功了
		return i ;//返回匹配成功时主串最后一个字符位置
	else return 0;
}
                                                                                        PS:菜鸟的KMP学习日记 BY 2020.11.25
                                                                                                               BY:Aaa2同学
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
KMP算法是一种字符串匹配算法,可以在一个文本串中查找一个模式串是否存在。它的时间复杂度为O(n+m),其中n和m分别是文本串和模式串的长度。 KMP算法的核心思想是利用已经匹配的部分字符信息来避免重复匹配。具体实现过程如下: 1. 预处理模式串,得到next数组。next[i]表示当第i个字符不匹配时,模式串应该从哪个位置开始继续匹配。 2. 在文本串中进行匹配。从文本串的第一个字符开始,依次与模式串的字符进行匹配。如果匹配成功,则继续匹配下一个字符。如果匹配失败,则根据next数组将模式串向右移动一定的距离,然后再从当前位置重新开始匹配。 下面是KMP算法的C语言实现: ``` #include <stdio.h> #include <string.h> void getNext(char* pattern, int* next) { int len = strlen(pattern); int i = 0, j = -1; next = -1; while (i < len) { if (j == -1 || pattern[i] == pattern[j]) { i++; j++; next[i] = j; } else { j = next[j]; } } } int kmp(char* text, char* pattern) { int tlen = strlen(text); int plen = strlen(pattern); int i = 0, j = 0; int* next = (int*)malloc(plen * sizeof(int)); getNext(pattern, next); while (i < tlen && j < plen) { if (j == -1 || text[i] == pattern[j]) { i++; j++; } else { j = next[j]; } } free(next); if (j == plen) { return i - j; } else { return -1; } } int main() { char text[] = "hello world"; char pattern[] = "world"; int pos = kmp(text, pattern); if (pos != -1) { printf("pattern found at position %d\n", pos); } else { printf("pattern not found\n"); } return 0; } ```

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值