算法与数据结构学习之路三:算法与数据结构的融合应用 -- 字符串


六、字符串
1.字符串匹配问题 – KMP

   KMP算法是一种改进的字符串匹配算法。KMP算法的核心是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的,消除了指针i的回溯问题。KMP算法的时间复杂度O(m+n)。设主串为Str,模式串为Pat,以
   Str=BBC ABCDAB ABCDABCDABDE      Pat=ABCDABD 为例,介绍KMP算法。
   Step1: 寻找模式串Pat中各个子串的前缀后缀最长公共元素长度

在这里插入图片描述
    Step2: 根据最大公共元素长度计算 Next数组, Next数组相当于最大长度表整体向右移动一位,然后初始值赋值为-1。
在这里插入图片描述
   从前两步可以发现,最大公共元素长度n=模式串中前n位与模式串中后n位相同的个数,如 ABCD AB的公共元素长度为2。因此其程序及流程如下:

vector<int> getnext(string needle){
    int len=needle.size();
    vector<int>next;
    next.push_back(-1);  //next数组的首位为-1
    int slow=-1;    //slow指向子串的当前匹配的前缀位置    
    int quick=0;   //quick指向子串的当前匹配的后缀位置   如:ABCBA,slow指向第一个A,quick指向最后一个A
    									//ABCDAB,slow指向第二个索引B,quick指向最后一个索引B
    while(quick<len){
        if(slow==-1 || needle[slow]==needle[quick]){    
            slow++;   //slow的值就是最大公共元素长度
            quick++;
            next.push_back(slow);
        }else
            slow=next[slow];
    }
    return next;
}

在这里插入图片描述

    Step3: 根据Next数组进行字符串匹配:
   假设现在文本串S匹配到 i 位置,模式串P匹配到 j 位置。
   (1).如果 j=-1,或者当前字符匹配成功(即Str[i] == Pat[j]),都令 i++,j++,继续匹配下一个字符;
   (2).如果 j !=-1,且当前字符匹配失败(即S[i] != P[j]),则令 i 不变, j = Next[j]。此举意味着失配时,模式串P相对于文本串S向右移动了 j-Next[j] 位。换言之,当匹配失败时, 模式串向右移动的位数为:失配字符所在位置 - 失配字符对应的next 值即移动的实际位数为:j-next[j],且此值大于等于1。 如下图所示:
在这里插入图片描述

class Solution {
public:
    vector<int> getnext(string needle){  //计算Next数组
        vector<int> next;
        int slow=-1;
        int quick=0;
        next.push_back(-1);
        while(quick<needle.size()){
            if(slow==-1 || needle[slow]==needle[quick]){
                slow++;
                quick++;
                next.push_back(slow);
            }else
                slow=next[slow];
        }
    }
	//KMP算法
    int strStr(string haystack, string needle) {
       if(needle.empty())
           return 0;
        int len1=haystack.size();
        int len2=needle.size();
        vector<int>next;   //next数组
        next=getnext(needle);   //获取next数组
        int i=0;
        int j=0;
        while(i<len1 && j<len2){
            if(j==-1 || haystack[i]==needle[j]){
                i++;  //主串Str指针
                j++;  //模式串Pat指针
            }else{
                j=next[j];  //当前字符匹配失败,i不变,j=next[j]
            }
        }
        if(j==len2)
            return i-j;
        
        return -1;        
    }
};
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值