算法基础期末考点总结二十六——串匹配算法

最新推荐文章于 2022-03-26 19:31:15 发布

阿列克谢·米哈伊洛维奇

最新推荐文章于 2022-03-26 19:31:15 发布

阅读量144

点赞数

分类专栏：算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43416013/article/details/112594415

版权

算法专栏收录该内容

27 篇文章 2 订阅

订阅专栏

串匹配问题

一定义
串匹配问题的定义很简单，就是要在一般很长的文本中找和我手中的文本一样的串，就好像现在屏蔽词的机制，就得识别出文本中需要屏蔽的词的位置。

二专业术语
模式串P：查找的目标，长度一般记作m
文本串T：待查找的文本长度一般记作n
有效偏移s：等价于模式串在文本串的s+1位置开始出现
后缀：】
前缀：【

三算法
1.BF算法
最简单粗暴的算法：每一个可能为开头的字符都要考虑一下，时间复杂度为O（mn）
在这里插入图片描述
2.RK算法
添加了预处理的部分，对模式串可能出现的n-m个位置，赋予其一个值，既要考虑让伪命中点少，又要使得计算过程简化，最好算第一个以后可以通过常数时间算出后面的。
直接用d进制数表示（d为字母集的大小），然后改进为模一个数q，算出第一个位置的p值以后，用以下递归式算后续的：
在这里插入图片描述
关于h，看一个例子（高糊）：

这里模式串长为5，10的四次方mod13为3.
关于q的缺陷：

算法伪代码：

3.有限状态机算法
五元组：
状态集
初始状态
接受（终止）状态
字母表
状态转移函数

3个函数：
在这里插入图片描述

在这里插入图片描述

我们为了方便，就把状态定为数字，其数值即σ函数。

状态转移表和具体的状态转移例子如下：
在这里插入图片描述

有限状态机算法的匹配时间为O（n），但是预处理时间为O（m^3|∑|）
在这里插入图片描述

在这里插入图片描述
4.KMP算法
有限状态机算法的扩展，目标是更简化的求状态转移函数，我们用Π数组来代替状态转移表。

例1：

记得：Π[q]永远比q小

计算Π数组：在这里插入图片描述
利用预处理得到的Π数组匹配字符串：

阿列克谢·米哈伊洛维奇

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
算法基础期末考点总结二十六——串匹配算法

串匹配问题一定义串匹配问题的定义很简单，就是要在一般很长的文本中找和我手中的文本一样的串，就好像现在屏蔽词的机制，就得识别出文本中需要屏蔽的词的位置。二专业术语模式串P：查找的目标，长度一般记作m文本串T：待查找的文本长度一般记作n有效偏移s：等价于模式串在文本串的s+1位置开始出现后缀：】前缀：【三算法1.BF算法最简单粗暴的算法：每一个可能为开头的字符都要考虑一下，时间复杂度为O（mn）2.RK算法添加了预处理的部分，对模式串可能出现的n-m个位置，赋予其一个值，既
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。