KMP字符串匹配算法

在计算机科学中,Knuth-Morris-Pratt字符串查找算法(简称为KMP算法)可在一个主文本字符串S内查找一个词W的出现位置。此算法通过运用对这个词在不匹配时本身就包含足够的信息来确定下一个匹配将在哪里开始的发现,从而避免重新检查先前匹配的字符。

第一步求出字符串前缀表的值

#include <stdio.h>
/*
   prefix_table这个函数,给定一个字符串patten,和其长度n
   求出 prefix[]: patten所有前缀,前面后面相同的长度 
*/
void prefix_table(char patten[], int prefix[], int n){
	prefix[0] = 0;//第一个字符的相同的长度肯定是0 
	int len = 0;//len的意思为前一个字符的prefix 
	int i = 1;//从第一个开始计算 
	while (i < n){
		if (patten[i] == patten[len]){
			len++;
			prefix[i] = len;
			i++;
		}
		else{
			if (len > 0){//如果不设置这个条件当patten[0] != patten[i],数组会越界 
				len = prefix[len - 1];
			}
			else{//如果len == 0, 并且patten[0] != patten[i],那么直接给prefix[i]赋0即可 
				prefix[i] = len;
				i++;
			}
		}
	}
}

int main(){
	char patten[] = "ABABCABAA";
	int prefix[9];
	prefix_table(patten, prefix, 9);
	int i = 0;
	for (i = 0; i < 9; i++){
		printf("%d\n", prefix[i]);
	}
	return 0;
}

第二步将前缀表往后错一位,prefix[0]赋值为0

增加函数

void move_prefix_table(int prefix[], int n){//往后错一位,目的是让前缀表对应前一个字符的值 
	for (int i = n - 1; i > 0; i--){
		prefix[i] = prefix[i - 1];
	}
	prefix[0] = -1;
} 

第三步,加入查找程序

void search_patten(char patten[], char test[], int prefix[]){
	int n = strlen(patten);
	int m = strlen(test);
	int i = 0, j = 0;
//	int* prefix = malloc(sizeof(int) * n);
	prefix_table(patten , prefix, n);
	move_prefix_table(prefix, n);
	//test[i], len[test] = m;
	//patten[j], len[patten] = n;
	
	while(i < m){
		if (j == n - 1 && test[i] == patten[j]){
			printf("Found patten at %d\n", i - j);
			j = prefix[j];
		}
		if (test[i] == patten[j]){
			i++;
			j++;
		}
		else{
			j = prefix[j];
			if (j == -1){
				i++;
				j++;
			}
		}
	}
}

总程序

#include <stdio.h>
#include <string.h>
#include <stdlib.h>
/*
   prefix_table这个函数,给定一个字符串patten,和其长度n
   求出 prefix[]: patten所有前缀,前面后面相同的长度 
*/
void prefix_table(char patten[], int prefix[], int n){
	prefix[0] = 0;//第一个字符的相同的长度肯定是0 
	int len = 0;//len的意思为前一个字符的prefix 
	int i = 1;//从第一个开始计算 
	while (i < n){
		if (patten[i] == patten[len]){
			len++;
			prefix[i] = len;
			i++;
		}
		else{
			if (len > 0){//如果不设置这个条件当patten[0] != patten[i],数组会越界 
				len = prefix[len - 1];
			}
			else{//如果len == 0, 并且patten[0] != patten[i],那么直接给prefix[i]赋0即可 
				prefix[i] = len;
				i++;
			}
		}
	}
}


void move_prefix_table(int prefix[], int n){//往后错一位,目的是让前缀表对应前一个字符的值 
	for (int i = n - 1; i > 0; i--){
		prefix[i] = prefix[i - 1];
	}
	prefix[0] = -1;
} 


void search_patten(char patten[], char test[], int prefix[]){
	int n = strlen(patten);
	int m = strlen(test);
	int i = 0, j = 0;
//	int* prefix = malloc(sizeof(int) * n);
	prefix_table(patten , prefix, n);
	move_prefix_table(prefix, n);
	//test[i], len[test] = m;
	//patten[j], len[patten] = n;
	
	while(i < m){
		if (j == n - 1 && test[i] == patten[j]){
			printf("Found patten at %d\n", i - j);
			j = prefix[j];
		}
		if (test[i] == patten[j]){
			i++;
			j++;
		}
		else{
			j = prefix[j];
			if (j == -1){
				i++;
				j++;
			}
		}
	}
}
int main(){
	char patten[] = "ABABCABAA";
	char test[] = "AAABABCABAAJKKAJKASDASADA";
	int prefix[9] = {0};
	search_patten(patten, test, prefix);
	
//	int prefix[9];
//	prefix_table(patten, prefix, 9);
//	move_prefix_table(prefix, 9);
//	int i = 0;
//	for (i = 0; i < 9; i++){
//		printf("%d\n", prefix[i]);
//	}
	return 0;
}

学习资料
正月点灯笼-KMP算法1 思路
正月点灯笼-KMP算法2 具体程序

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值