滑动距离函数:
为方便讨论,BM算法的关键是,对给定的模式T="t0t1…tm"定义一个从字符到正整数的映射:
distance :c->{1,2,…,m+1}
函数distance称为滑动距离函数,它给出了正文中可能出现的任意字符在模式中的位置。函数distance定义如下:
dist(c) = m-j j为c在模式中的下标,以后面的为准
dist(c) = m+1 若c不在模式中或c = tm
例如,T="pattern",则dist(p)= 6 – 0 = 6, dist(a)= 6 – 1 =5, distance(t)=6-3=3,dist(e)= 2, dist(r)= 1, dist(n)= 6 + 1 = 7。
BM算法的基本思想是:
假设将主串中自位置i起往左的一个子串与模式进行从右到左的匹配过程中,若发现不匹配,则下次应从主串的i + dist(si)位置开始重新进行新一轮的匹配,其效果相当于把模式和主串向右滑过一段距离distance(si),即跳过distance(si)个字符而无需进行比较。
一个具体的例子,如下图所示:
源码:
#include<iostream>
#include<cstring>
using namespace std;
char T[10000],P[10000];
int distance(char *p,char ch)
{
int len=strlen(p);
int i=len-1;
if(p[i]==ch)
return len;
i--;
while(i>=0)
{
if(p[i]==ch)
return len-1-i;
i--;
}
return len;
}
int BM(char *p,char *t)
{
int x=strlen(p);
int y=strlen(t);
int i=y-1;
int j=y-1;
while(j>=0 && i<x)
{
if(p[i] == t[j])
{
i--;
j--;
}
else
{
i += distance(t,p[i]);
j = y-1;
}
}
if(j < 0)
{
return i+1;
}
return -1;
}
int main()
{
cin>>T>>P;
cout<<BM(T,P);
getchar();
return 0;
}
复杂度分析
...............