Vision_字符串_KMP

///定义:
/*
        KMP算法是一种改进的字符串匹配算法,由D.E.Knuth,J.H.Morris和
    V.R.Pratt同时发现,因此人们称它为克努特——莫里斯——普拉特操作(简称KMP
    算法)。KMP算法的关键是利用匹配失败后的信息,尽量减少模式串与主串的匹
    配次数以达到快速匹配的目的。具体实现就是实现一个next()函数,函数本身包含
    了模式串的局部匹配信息。时间复杂度O(m+n)。
*/

///代码:

/*
**name:KMP
**function:匹配模式串与母串
**输入参数:模式串与母串
**输出参数:模式串在母串中第一次出现的位置
**时间复杂度:O(m+n)
*/
#include <iostream>
#include <cstring>
#include <cstdio>
#include <cmath>
#include <algorithm>
using namespace std;
const int maxn = 100;
char s[maxn],str[maxn];///s是母串,str是模式串
int next[maxn];
void getnext(){
    int i = 0,j = -1;
    next[i] = -1;
    int len = strlen(str);
    while(i<len){
        if(j==-1||str[i]==str[j]){
            i++;
            j++;
            ///优化next数组
            /*
                if(str[i]!=sr[j])next[i]=j;
                else next[i]=next[j];
            */
            ///非优化next数组
            next[i] = j;
        }
        else j = next[j];
    }
    for(int i = 0;i<=len;i++)cout<<" "<<next[i];
    cout<<endl;
}
int KMP(){
    getnext();
    int  i = 0,j = 0;
    int lens = strlen(s);
    int len = strlen(str);
    ///判断str是否在s中出现过
    while(i<lens&&j<len){
        if(j==-1||s[i]==str[j]){
            i++;
            j++;
        }
        else j = next[j];
    }
    if(j>=len)return i-len;
    else return -1;
    ///计算可重叠str在s中出现的次数
    /*
        int num = 0;
        while(i<lens){
            if(j==-1||s[i]==str[j]){
                i++;
                j++;
            }
            else j = next[j];
            if(j>=len){
                num++;
                j = next[j];
            }
        }
        return num;
    */
}
int main(){
    cin>>s>>str;
    cout<<KMP()<<endl;
    return 0;
}

///扩展:
/*
          (1)给定一个字符串,问最多是多少个相同子串不重叠连接构成。
    KMP的next数组应用。这里主要是如何判断是否有这样的子串,和子串的个数。
    若为abababa,显然除其本身外,没有子串满足条件。而分析其next数组,next[7] = 5,next[5] = 3,next[3] = 1即str[2..7]可由ba子串连接构成,那怎么否定这样的情况呢?很简单,若该子串满足条件,则len%sublen必为0。sunlen可由上面的分析得到为len-next[len]。
    因为子串是首尾相接,len/sublen即为substr的个数。
    若L%(L-next[L])==0,n = L/(L-next[L]),else n = 1
          (2)大意:给出一个字符串A,求A有多少个前缀同时也是后缀,从小到大
    输出这些前缀的长 度。
    *分析:KMP
    对于长度为len的字符串,由next的定义知:
    A[0]A[1]...A[next[len]-1]=A[len-next[len]]...A[len-1]此时
    A[0]A[1]...A[next[len]-1]为一个符合条件的前缀
    有A[0]A[1]....A[next[next[len]]-1] = A[len-next[next[len]
    - next[next[len]]]...A[next[len]-1],故A[0]A[1]....A[next[next[len]]-1]
    也是一个符合条件的前缀故从len=>next[len]=>next[next[len]] ....=>直到
    某个next[]为0均为合法答案,注意当首位单词相同时,也为答案。
*/

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值