sunday算法和kmp算法

ykio

已于 2022-09-18 10:16:59 修改

阅读量363

点赞数

文章标签：算法数据结构哈希算法

于 2022-09-17 12:17:48 首次发布

本文链接：https://blog.csdn.net/weixin_44656636/article/details/126903550

版权

最近看到一个字符串匹配算法sunday，类似于kmp算法，特此记录一下。

---->sunday算法

sunday算法关注的是，每次匹配不成功后主串中下一位不与模式串进行比较的位置（如下图中，第一次匹配不成功，然后马上关注主串中‘S’的下一位，即空格），此时分为两种情况—>1.该位曾在匹配串中出现过。2.该位不曾在匹配串中出现。
在这里插入图片描述
~~---------------------------------------------------------------------------------------------------------------------------------------------------~~
1.该位不曾在匹配串中出现
如上图，空格不在模式串中出现，就将模式串直接移到空格后的一位，如下图。

在这里插入图片描述
2.该位曾在匹配串中出现
如上图，第二次匹配不成功时候，主串中‘L’的后一位‘E’曾在模式串中出现过，就将模式串中最后一个与该位相同的位对齐，如下图。

重复以上步骤，直到找到主串中与模式串匹配的字串即是sunday算法。
~~-----------------------------------------------------------------------------------------------------------------------------------------------------~~

代码实现

我们首先定义两个变量，一个存放模式串在主串中偏移的位置begin，另一个即是每次比较主串与匹配串的cur。sunday算法在每次匹配不成功后，要找到主串中的下一位最后一次出现在模式串中的位置，如果每次匹配不成功都从尾向前遍历模式串寻找的话时间复杂度太高。不妨定义一个哈希表来存储模式串每一位的位置。完整代码如下。

class Solution {
public:
    int strStr(string haystack, string needle) {
        unordered_map<char, int> map;
        int m = haystack.size();
        int n = needle.size();

        for(int i = 0; i < n; ++i) map[needle[i]] = n - i;	//储存模式串中的每一位，n-i即是该位要前进的步数。

        int begin = 0, cur;		//begin是模式串前进的步数，cur是模式串中匹配的位置
        while(begin <= m - n){
            cur = 0;	//每次begin移位后，都要重头开始比较模式串与匹配串
            while(haystack[begin + cur] == needle[cur]){
                ++cur;
                if(cur == n) return begin;	//完全匹配成功即返回begin
            }

            begin += (map.count(haystack[begin + n]) ? map[haystack[begin + n]] : n + 1);	
            //匹配不成功，分两种情况，如果没有出现在模式串，begin要走n+1步，如果出现在模式串即走map中存放的步数
        }

        return -1;
    }
};