KMP( O(n)时间,子字符串查找 )

简介:

基本思路:在寻找的过程中,文本指针i,并不回退,而是去移动模式指针j的值,那这个移动到哪个位置是去查询next数组(ptr_p=next【ptr_p】)

而next 【i】 实际上是模式字符串里面以下标i-1为尾的子串,它的最长相同前缀和后缀的长度。next数组的构建是通过递推来进行的

理解:左神p542

详细理解:https://blog.csdn.net/v_july_v/article/details/7041827

简略理解: https://www.cnblogs.com/grandyang/p/6992403.html

代码:

void getnext(string pat, vector<int> &next) {
	if (pat.size() == 1) {
		next[0] = -1;
		return;
	}
	next[0] = -1;
	next[1] = 0; // 2个初值
	int i = 2; // 当前位置
	int cn = next[i - 1];// 上一个位置的next值,也就是会跟pat【i-1】被比较对象的下标位置
	while (i < pat.size()) {
		if (pat[i - 1] == pat[cn]) {
			next[i++] = ++cn;
		}
		else if (cn > 0) {
			cn = next[cn]; // // 不相等 且 cn大于0,因为next[0]=-1也就是还有位置
		}
		else {
			next[i++] = 0; // 不用设置cn 是因为隐含cn等于0了
		}
	}
	return;

}

int KMP(string text, string pat) {
	if (text.size() == 0 || pat.size() == 0)
		return -1;

	vector<int> next(pat.size());

	getnext(pat, next);
	int ptr_t = 0; // 文本指针
	int ptr_p = 0; // 模式指针

	int s1 = text.size();
	int s2 = pat.size();  // 必须保存这两个值,因为ptr_p可能会是-1,而size()返回的是无符号数,那么接下来的比较就会出错!!!很关键啊

	while (ptr_t<s1 && ptr_p<s2 ) {

		if (ptr_p == -1 || text[ptr_t] == pat[ptr_p]) {  //假如相同or模式指针没退路了,一起前进
			++ptr_p;
			++ptr_t;
		}
		else {
			ptr_p = next[ptr_p];
		}


	}

	cout << ptr_t << ptr_p << endl;
	return ptr_p == pat.size() ? ptr_t - ptr_p : -1; //注意是ptr_t - ptr_p 举例能验证

}

 

 

 

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值