字符串模式匹配算法

1.  Brute Force算法

最简单的二层循环,没有什么技巧,就是依次比较。

 

2. KMP算法

KMP算法主要是考虑模式串本身。也就是对于模式串而言,出现不匹配时,是否可以减少移动的位数。特别是模式串的重复字符串较多时。

 

3. Horspool算法

是一种后缀搜索算法。

匹配串:abcbcsdxzcxx

模式串:cbcac

从右向左对比,最左边,'c'='c';第二个'b'<>'a',此时,模式串从不匹配的那个字符开始从右向左寻找匹配串中不匹配的字符b的位置,本例有,移位比较。

匹配串: abcbcsdxzcxx

模式串:      cbcac

模式串继续从最右边的字符开始,从右向左进行比较

如果没有,那么直接将模式串移动到该字符的后面,如:

匹配串:abcecsdxzcxx

模式串:cbcac

从右向左对比,最左边,'c'='c';第二个'e'<>'a',此时,模式串从不匹配的那个字符开始从右向左寻找匹配串中不匹配的字符b的位置,没有找到。

匹配串:abcecsdxzcxx

模式串:         cbcac

 

 

4. Boyer-Moore算法

有点Horspool+KMP的思想。

分两步:当出现错误匹配的时候,移位,基本上就是做的Horspool那一套。

  当出现错误匹配的时候,我还要从不匹配点向左看,

以前匹配的那段子字符串在模式串本身中是否有重复,有重复就直接把重复的那段和匹配串中已经匹配的那一段对齐。

  匹配串:abaccbabbazz

  模式串:cbadcba

我们发现'c'<>'d'时

匹配串: abaccbabbazz

模式串:cbadcba

 

 

5.Sunday算法

同Horspool一样,采用后缀查找,当出现不匹配的时候,却不是去找匹配串中不匹配的字符在模式串的位置,而是直接找最右边对齐的右一位的那个字符在模式串的位置。

   匹配串:abcbczdxzc

   模式串:zbcac

   这里我们看到'b'<>'a',我们就看匹配串中的z在模式串的位置。

   匹配串:abcbczdxzc

   模式串:          zbcac

   如果模式串中的没有那个字符怎么办呢?

   匹配串:abcbcedxzcs 

   模式串:zbcac

  E不在模式串中出现,就直接跳过e

匹配串:abcbcedxzcs

模式串:             zbcac

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
1. 简单字符串模式匹配算法:也称为朴素字符串匹配算法,是一种基础的字符串匹配算法。它的思想是从主串的第一个字符开始,依次比较主串和模式串中对应位置的字符是否相等,如果相等则继续比较,直到模式串中所有字符都匹配成功,或者有一个字符不匹配为止。如果不匹配,则将主串的起始位置向后移动一位,重新开始匹配。该算法的时间复杂度为O(m*n),其中m和n分别为主串和模式串的长度。 2. 首位字符串模式匹配算法:也称为BF算法(Brute Force),是一种改进的字符串匹配算法。它的思想是在简单字符串模式匹配算法的基础上,当发现主串中某个字符与模式串中的某个字符不匹配时,不是将主串的起始位置向后移动一位,而是将模式串的起始位置向前移动到上一次比较成功的位置之后的下一位,继续匹配。这样可以减少比较次数,提高匹配效率。该算法的时间复杂度为O(m*n),其中m和n分别为主串和模式串的长度。 3. KMP字符串模式匹配算法:是一种高效的字符串匹配算法。它的核心思想是利用模式串自身的特性,预处理出一个next数组,使得在匹配过程中,当出现不匹配的情况时,可以通过next数组中的信息,跳过一部分比较,从而提高匹配效率。具体实现方法是,在预处理next数组时,从模式串的开头开始,计算出每个位置对应的最长前缀和最长后缀的公共部分长度,保存在next数组中。在匹配过程中,当出现不匹配的情况时,根据next数组中的信息,将模式串的起始位置向后移动一定的距离,从而跳过一些比较。该算法的时间复杂度为O(m+n),其中m和n分别为主串和模式串的长度。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值