leetcode-28-Implement strStr()

问题

题目:[leetcode-28]

思路

朴素的思路,主串回溯。

代码

class Solution {
public:
    int strStr(string haystack, string needle) {
        string& txt = haystack;
        string& pat = needle;

        int n = txt.size();
        int m = pat.size();
        int i = 0;
        int j = 0;

        while( i < n && j < m ){
            if( txt[i] == pat[j] ){ ++i; ++j; }
            else{ i = i-j+1; j = 0; }
        }
        if( j == m ) return i-j;
        else return -1;
    }
};

思路1

prefix数组是公共前缀-后缀的最大长度。
prefix[i]: pat[0—i]这个子串当中,所有前缀与所有后缀的最大公共长度。
注意,对于第一个字符,由于它自身的前缀和后缀就是它自己,设为1没有意义。因为,即使在下一个位置失配,当前位置自己和自己匹配没有意义。所以设为0。
所以,如果在第j个位置失配,那么表明前面的[0,j-1]是匹配的。所以,本质是对prefix[j-1]进行再次匹配,让前缀和后缀一样。这点要想明白。但是,对于prefix[i]本身来说,表明的还是pat[0—i]的最长前缀后缀的匹配长度。
当j失配时,进行更新j = prefix[j-1],这个长度刚还可以让txt[i],pat[j]再次比一次。因为pat前面的部分还是匹配的。
当然,还要判断上来就失配的情形,此时没有前缀。

模式串ABCDABD
prefix[i]0000120

next数组是prefix数组左移一位,低位补-1

下面代码中,j == -1的情形,说明的是,上来就失配。此时也没有公共前缀,所以j = -1, 下次两者同时向前。

整体的算法思路:
1.主串不回溯,利用已经匹配的信息找到j下一次匹配的位置。
2.如果 p[ j] == p[ next[j] ],虽然这是下次匹配的位置。但是,由于知道相等,即使匹配也会导致不匹配,可以进行优化。

代码1

class Solution {
public:
    int strStr(string haystack, string needle) {
        string& txt = haystack;
        string& pat = needle;

        int n = txt.size();
        int m = pat.size();
        if( !n && !m ) return 0;
        if( n && !m ) return 0;
        if( !n ) return -1;

        int i = 0;
        int j = 0;
        vector<int> prefix = get_prefix(pat);

        while( i < n && j < m ){
            if( -1 == j || txt[i] == pat[j] ) { ++i; ++j; }
            else{
                if(!j) j = -1;
                else j = prefix[j-1];// be careful
            }
        }
        if( j == m ) return i-j;
        else return -1;
    }
private:
    vector<int> get_prefix(const string& pat){
        int sz = pat.size();
        vector<int> prefix(sz);

        prefix[0] = 0;
        for(int i = 1; i < sz; ++i){
            int k = prefix[i-1];
            while( k > 0 && pat[k] != pat[i] ){
                k = prefix[k-1];
            }
            if( pat[i] == pat[k] ) prefix[i] = k + 1; // be careful
            else prefix[i] = 0;
        }

        return prefix;
    }
};

思路2

1.注意prefix的语义,以及prefix的生成。
2.对于j失配时,的操作需要注意。小心上来就失配的情形。

代码2

class Solution {
public:
    int strStr(const string& txt, string& pat) {
        int sz_txt = txt.size();
        int sz_pat = pat.size();

        if( sz_txt == 0 && sz_pat == 0 ) return 0;
        if( sz_txt && sz_pat == 0 ) return 0;
        if( !sz_pat ) return -1;

        int i = 0;
        int j = 0;
        set_prefix(pat);
        while( i < sz_txt && j < sz_pat ) {
            if( j == -1 || txt[i] == pat[j] ) { ++i; ++j;}
            else{
                if( j == 0 ) j = -1;
                else j = prefix[j-1];
            }
        }

        if( j == sz_pat ) return i-j;
        else return -1;
    }
private:
    void set_prefix(string& pat){
        int sz = pat.size();
        prefix.resize(sz);

        prefix[0] = 0;
        for(int i = 1; i < sz; ++i) {
            int k = prefix[i-1];
            while(k > 0 && pat[k] != pat[i]) k = prefix[k-1];
            if( pat[k] == pat[i] ) prefix[i] = k + 1;
            else prefix[i] = 0;
        }
    }
private:
    vector<int> prefix;
};
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值