pgsql匹配字符串的前缀和后缀_笃学不倦|串的模式匹配—字串(模式串)的定位操作...

本文介绍了在主串中查找子串的定位操作,重点讲解了朴素的BF算法和KMP算法。KMP算法利用已匹配信息避免回溯,通过next数组计算模式串的移动位置,提高了匹配效率。
摘要由CSDN通过智能技术生成

Hello,艾瑞巴蒂,今天讲讲关于字串(模式串)的定位操作的那些事儿!

“嘟嘟”敲黑板了,咱们要开始讲了,大家不要走神,请认真听讲,专业大哥已经上线!

ebef0e66a70bd5b806bbcb5249bc579f.png

字串(模式串)的定位操作

在主串(也称做目标串)S中,从位置start开始查找是否存在子串(也称做模式串)T,如果在主串S中查找到一个与模式串T相同的子串,则称查找成功;如在主串S中未找到一个与模式串T相同的子串,则称查找失败

当模式匹配成功时,函数返回模式串T的第一个字符在主串S中的位置;当模式匹配失败时,函数返回-1

朴素的模式匹配算法(Brute-Force算法)

BF算法的主要思想是:将主串S的第start个字符和模式T的第1个字符比较,若相等,继续逐个比较后续字符;若不等,从主串S的下一字符起,重新与T第一个字符比较,直到主串S的一个连续子串字符序列与模式T相等。返回值为S中与T匹配的子序列第一个字符的序号,即匹配成功。否则,匹配失败,返回值 –1

a1bd8adead74ccd93d639b1231242f6a.png

KMP算法

BF算法简单并且容易理解,但是有些情况下时间效率不高,最好情况下(一配就中)时间复杂度为O(m),平均时间复杂度为O(m),最坏情况下时间复杂度为O(n×m)
为了克服主串下标i在若干个字符序列比较相等后,只要有一个字符比较不相等便需要把下标i的值回退(回溯)的缺点,提出了改进的匹配算法KMP

1166e4cef165838680661db152c7d07e.png

KMP算法的主要思想是:利用已经部分匹配这个有效信息,保持i指针不回溯,通过修改j指针,让模式串尽量地移动到有效的位置,重点就在于当某一个字符与主串不匹配时,我们应该知道j指针要移动到哪里。

这可以分为两种情况来考虑:

· 当前Si和Tj比较不相等时当模式串中不存在可相互重叠的真子串,下一次可直接比较si和t0;

· 当模式串中存在可相互重叠的真子串时,j要移动的下一个位置为k,k满足:模式串中最前面的k个字符和j之前的最后k个字符是一样的。

所以,问题的重点:计算每一个位置j对应的k,所以用一个数组next来保存,next[j] = k,表示当S[i] != T[j]时,j指针的下一个位置

寻找前缀后缀最长公共元素长度

· 对于P = p0 p1 ...pj-1 pj,寻找模式串P中长度最大且相等的前缀和后缀。如果存在p0 p1 ...pk-1 pk = pj- k pj-k+1...pj-1 pj,那么在包含pj的模式串中有最大长度为k+1的

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值