算法设计：精确字符串匹配

最新推荐文章于 2022-07-13 10:50:08 发布

李小星同志

最新推荐文章于 2022-07-13 10:50:08 发布

阅读量395

点赞数

分类专栏：算法设计文章标签：算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/LI_XIAO_XING/article/details/121228088

版权

算法设计专栏收录该内容

11 篇文章 2 订阅

订阅专栏

首先来学学精确字符串匹配：

那我们要怎么找呢？：

好麻烦，有没有别的？：

指纹就是一个标识符，但这个标识符怎么找呢？

就是把每个字母当成一位十进制数的数字，我开头记录下目标的字符串是什么数字，然后再一个一个向前比较，数字相同就找到了。这和上面的暴力搜索一样也是一个一个向前找，但这个在比较m个字符串的时候复杂度大大降低了，总是只要改变2位，m再大也不怕。

但这个方法显然存在缺点。我要把一个字符串变成一个数，假如这个字符串很大，那这个数字就要大的受不了。我们来学习新的方法：

同一个数mod 了右mod,结果是一样的，所以这个公式是正确的。

现在介绍的方法都有一个问题，那就是每次比较都没有使用之前的知识，每次都重新比较。我想让每个字符都只匹配一次：

简单来讲，PI[q]的计算方法就是：计算我们要找的字符串P中前q个字符中，前缀等于后缀的最大部分。例如：

这样，我们在实际寻找这个字符串的时候，假如遇到了“有一部分相等”的情况，我们可以根据之前相等的部分直接跳过中间部分，利用了之前的记忆。

就比如开头的那一步，我发现头5个相等，第6个不等，我看一看我的PI[]数组，发现PI[5]=3，也就是说头三个和后三个是一样的，所以我们直接跳到后三个，这样就可以快很多了。

现在我们来看看逆方法：

就是反过来的暴力算法。

简单来说就是：我比较了一下P和我们目前搜索的部分，发现不一样，那我就看一下我搜索的部分的最后那个字符，看一下：我的P要往前走几位才能遇到和这一位相等的？移动的位数就是shift[字符]的大小。例如我发现最后一个字符是e，那我要往前走4位才能遇到下一个e，所以shift[e]=4.假如最后哪一位压根就不在P里，那当然就直接是移动m位欲避之而不及。

最后这两种方法都运用了“记忆”。

李小星同志

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
算法设计：精确字符串匹配

首先来学学精确字符串匹配：那我们要怎么找呢？：好麻烦，有没有别的？：指纹就是一个标识符，但这个标识符怎么找呢？就是把每个字母当成一位十进制数的数字，我开头记录下目标的字符串是什么数字，然后再一个一个向前比较，数字相同就找到了。这和上面的暴力搜索一样也是一个一个向前找，但这个在比较m个字符串的时候复杂度大大降低了，总是只要改变2位，m再大也不怕。但这个方法显然存在缺点。我要把一个字符串变成一个数，假如这个字符串很大，那这个数字就要大的受不了。我们来学习新的方法：...
复制链接

扫一扫

专栏目录

李小星同志 CSDN认证博客专家 CSDN认证企业博客

码龄4年

179: 原创

3万+: 周排名

2万+: 总排名

25万+: 访问

: 等级

2196: 积分

494: 粉丝

306: 获赞

26: 评论

1559: 收藏

私信

关注

热门文章

分类专栏

最新评论

计算机组成原理：原码的乘法运算
zhi21yuan15: 谢谢,解决了疑惑。
计算机组成原理：原，反，补码，加减运算，溢出判断，符号扩展
做而论道_CS: 变形补码、双符号位！一直也没有听说，谁家的 CPU 有这种配置。 Intel 的 CPU 中，有一个溢出标志位 OF。它可以自动判别并给出：运算是否溢出！已经有这个现成的标志，还研究 “双符号位” 干嘛？－－－－－－－－－－－－任何一个数，无论是一个字节，或是一个字，都只有一个符号位。是在计算的时候，多弄一个符号位吗？　16 位的 CPU，用 17 位来计算？　32 位的 CPU，用 33 位来计算？什么品牌型号的 CPU，有这种功能啊！从来就没有听说过。双符号位、变形补码，只是某些老师的梦呓而已。不能当真的。
计算机组成原理：原，反，补码，加减运算，溢出判断，符号扩展
做而论道_CS: 另外，计算机行业有个翻番的摩尔定律。现在的计算机，比 8086，都不知翻多少番了！现在的计算机中，已经不是 “只有加法器” 了做运算，现在用的是 ALU (算术逻辑单元)。在 ALU 的功能中，已经有了减法运算！那么，想要相减，直接相减就可以了。计算机专业的老师，对此视而不见！仍然喋喋不休的讲 “取反加一”。为什么呢？居心叵测呀！现在终于知道我们缺芯片用的原因了。
计算机组成原理：原，反，补码，加减运算，溢出判断，符号扩展
做而论道_CS: 实际上，计算机只有二进制数。并没有什么符号位原码反码补码。二进制数，也是数，和十进制数，是雷同的。－－－－－－－－－－－－－－－－－－－－－如果使用数字，代表其它信息，才叫做 “码”。如：学号、门牌车牌电话性别书号密码等等。－－－－－－－－－－－－－－－－－－－－－所谓的 “补码”，实际上，它就是一个正数。正数，能当负数用吗？能！关键在于：【舍弃进位】！你看十进制数，两位，范围是：0 ~ 99。那么：38 + 99 = (一百) 37 　　　38 － 1 = 37 舍弃进位，这两种算法，功能就是相同的。　正数，就能当负数来用！　加法，就成了减法！在计算机中，利用此思路，减法器，就省掉了！八位二进制，范围是：0000 0000 ~ 1111 1111。相当于十进制的：0 ~ 255。如果舍弃进位，255 (即 1111 1111)，就能当－1 来使用。你用二进制加法，算一下，便可证明出来。同理，254 (即 1111 1110)，就是－2 了。继续，253 (即 1111 1101)，就是－3 了。。。。这些正数，就被计算机专家称之为：补码。实际上，它们仍然还是数！称为 “码”，是因为，计算机专家不懂算术。由 255 (即 1111 1111) 能当－1，可知：　负数的补码＝ 256 ＋该负数。例题：－50 的补码是什么？求解： 256 ＋ (－50) ＝ 206，　　　 206 = 1100 1110 (二进制)。求补码，就是这么简单！所谓的：　机器数真值符号位原码反码补码正数三码相同　负数取反加一符号位不变模同余符号位也参加运算 ,,, 都是毫无用处的垃圾！正数和零的补码，也可以用这个公式，即：　正数的补码＝ 256 ＋该正数。加上 256，就出现了进位。把进位舍弃掉，就是：　正数的补码＝ 256 ＋该正数　　　　　　＝该正数。这就证明了：正数和零的补码，就是其本身。
数理逻辑 2
csy031117: 是 hitsz 的学长吗？😊

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。