模式匹配算法

下面分别介绍:朴素模式匹配算法 改进模式匹配算法(KMP)

朴素模式匹配算法思想:

从目标S中的第一个字符开始和模式T中的的第一个比较(用  i  和 j 分别指示S串和T串中正在比较字符的位置),若相等,则继续逐个比较后续字符,否则, 从S 的第二字符重新开始匹配,直到匹配完成。

核心就是 i = i - j +1 ;  //其中 j 就是已经匹配字符的个数 。+1 带表下一次匹配的位置。

///朴素匹配
#include<iostream>
#include<cstdio>
#include<cstring>
using namespace std;
int Index(char S[],char T[]){
    int i,j;
    i=0;j=0;
    int lens=strlen(S);
    int lent=strlen(T);
   // cout<<lent<<" "<<lens;
  while(i<lens&&j<lent){
    if(S[i]==T[j]){
        i++;
        j++;
    }
    else{
        i=i-j+1;///然现在T串已经匹配了j 的长度,所以直接将 i 回退 j 个长度
        j=0;
    }
  }
  if(j=lent-1)///T 已经匹配结束,然后S 串中的起始位置
    return i-lent;
  else
    return -1;
}
int main()
{
    char S[10000]="afdfsdgdfbsderre";
    char T[10000]="dgdf";
    cout<<Index(S,T)<<endl;
    return 0;
}

 

改进模式匹配算法(KMP)

时间复杂度O(n +  m)

它的改进之处:每一趟匹配过程中出现字符比较不相等时,不需要回溯  i 值 ,而是利用已经的 “ 部分匹配” 的结果将 T(模式)向右 “滑动” 尽可能远的一段距离后在进行比较。 (用通俗的讲: 就是现在不需要将 i 值往会移动, 而是将 T(模式串) 往右移动。具体移动到到哪里就根据next[] 数组的值确定 )

下面介绍如何求解模式串的next 数组值:

根据当位置的前 一个串 的 前缀和后缀串的最多匹配字符个数 //例如当前位置是 j  , 就看 0 ~ j-1  这个串的前后缀最多匹配字符数

需要补充的是:0~j-1 这个串的前缀和后缀分别是 1~j-1   和 0~j-2  (意思就是前缀部包括第一个字符, 后最不包括最后一个字符)

求解以前: 自己需要根据题目要求, 设定 next 的起始位置的值, 有的是 0 , 有的则是 以1 ; 具体就看 字符串的起始位置。

下面介绍next 索引 从0 开始

例如: abaabaac   

首先 next[0] =0;

求 next[1] 的值得的时候, 我们就看 0~0    显然前缀和后缀串都是空串 所以是 0 

next[1] =0;

求 next[2] 的值得的时候, 我们就看 0~1   显然前缀1~1和后缀串 0~0 ; 显然不匹配 所以

next[2]=0;

同理 next[3]=0;

求 next[4]  的值得的时候, 我们就看 0~3   显然前缀1~3和后缀串 0~2 ; 显然t[3]==t[0] =='a'

next[4]=1;

后面的依次类推。

#include<iostream>
#include<cstdio>
#include<cstring>
using namespace std;
const int Maxsize =10000;
void Get_next(char T[],int(&next)[Maxsize]){///next 的索引从0开始,获取next数组
    int i=0,j=-1;
    next[0]=-1;///初始化
    int len =strlen(T);
    while(i<len){
        if(j==-1||T[j]==T[i]){
            ++i;
            ++j;
            next[i]=j;///
        }
        else
            j=next[j];
    }
}
void Get_nextval(char T[],int (&nextval)[Maxsize],int next[]){///获取nextval
    int j=0;
    nextval[0]=-1;///初始化
    int len =strlen(T);
    for(j=1;j<len;j++){
        if(T[next[j]]==T[j])
            nextval[j]=nextval[next[j]];
        else
            nextval[j]=next[j];
    }
}
int Index(char S[],int next[],char T[]){///进行模式匹配
    int i=0,j=0;
    int len =strlen(S);
     int lent =strlen(T);
    while(i<len&&j<lent){
        if((j==-1)||(S[i]==T[j])){
            i++;
            j++;
        }
        else
            j=next[j];
    }
    if(j==lent)
        return i-lent;
    else
        return -1;
}
int main()
{
     int next[Maxsize];
     int nextval[Maxsize];
     char S[Maxsize]="afdfsdgdfbsderre";
     char T[Maxsize]="bsder";
     Get_next(T,next);
     Get_nextval(T,nextval,next);
     cout<<Index(S,next,T)<<endl;///通过next数组匹配获取位置信息
     cout<<Index(S,nextval,T)<<endl;///通过nextval数组匹配获取位置信息
    return 0;
}

 

  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值