有关字符串查找算法搜藏 Boyer-mooer,KMP

 BM算法是Boyer-Moore算法的简称,由Bob Boyer 和J Strother Moore在1977年提出,它是一个非常有效的字符串匹配算法。

 

  滑动距离函数:

        为方便讨论,BM算法的关键是,对给定的模式T="t0t1…tm"定义一个从字符到正整数的映射: 
        distance :c->{1,2,…,m+1}   
        函数distance称为滑动距离函数,它给出了正文中可能出现的任意字符在模式中的位置。函数distance定义如下:  
        dist(c) = m-j  j为c在模式中的下标,以后面的为准 
        dist(c) = m+1  若c不在模式中或c = tm 
        例如,T="pattern",则dist(p)= 6 – 0 = 6, dist(a)= 6 – 1 =5, distance(t)=6-3=3,dist(e)= 2, dist(r)= 1, dist(n)= 6 + 1 = 7。

       BM算法的基本思想是:

        假设将主串中自位置i起往左的一个子串与模式进行从右到左的匹配过程中,若发现不匹配,则下次应从主串的i + dist(si)位置开始重新进行新一轮的匹配,其效果相当于把模式和主串向右滑过一段距离distance(si),即跳过distance(si)个字符而无需进行比较。 

一个具体的例子,如下图所示:


源码:

#include<iostream>  

#include<cstring>  

using namespace std;  

 

char T[10000],P[10000];  

 

int distance(char *p,char ch)  

{  

    int len=strlen(p);  

    int i=len-1;  

    if(p[i]==ch)  

        return len;  

    i--;  

    while(i>=0)  

    {  

        if(p[i]==ch)  

            return len-1-i;  

        i--;  

    } 

return len;

}  

 

int BM(char *p,char *t)  

{  

    int x=strlen(p);  

    int y=strlen(t);  

    int i=y-1;  

    int j=y-1;  

    while(j>=0 && i<x)     

    {     

        if(p[i] == t[j])     

        {     

            i--;     

            j--;     

        }     

        else    

        {     

            i += distance(t,p[i]);     

            j = y-1;     

        }     

    }     

    if(j < 0)     

    {     

        return i+1;     

    }     

    return -1;     

}     

 

int main()  

{  

    cin>>T>>P;  

    cout<<BM(T,P);  

getchar();

    return 0;  

}  

复杂度分析

...............
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值