直接用后缀数组求出A串中所有与B串匹配的位置(既然这里用后缀数组,我就不用KMP了,直接用RMQ求LCP) 。
关键是第二步。对于每个 后缀 , 如果这个后缀的前缀( sa[i] sa[i+1].......sa[i]+h[i] ) 这段中包含B串 则直接跳过,否则 求出两个端点 l,r ,其中 l 为sa[i]+h[i], r为满足(r>=l) 且下标最小的B串匹配位置减去 1(ans=r-l+1), 当然也可以不减去1(ans=r-l);
#include<cstdio>
#include<cstring>
#include<algorithm>
#include<iostream>
#include<bitset>
#include<cmath>
#include<queue>
using namespace std;
typedef long long ll;
typedef pair<int,int> pii;
const int maxn = 111111;
const int INF = 0x7f7f7f7f;
int wa[maxn],wb[maxn],wv[maxn],wn[maxn],a[maxn];
int h[maxn],sa[maxn],rank[maxn];
char str[maxn];
struct RMQ
{
int i,j,k;
int n,r[20][maxn];
void make(int a[])
{
for(i=1;i<=n;++i) r[0][i]=a[i];
for(i=0;i<19;++i)
{
k=1<<i;
for(j=1;j+k<=n;++j)
r[i+1][j]=min(r[i][j+k],r[i][j]);
}
}
int query(int L,int R)
{
i=1,j=R-L,k=0;
while(i*2<j)
++k,i<<=1;
return min(r[k][L],r[k][R-i]);
}
}rmq;
bool cmp(int r[],int a,int b,int l)
{
return r[a]==r[b]&&r[a+l]==r[b+l];
}
void Calheight(int r[],int n)
{
int i,j,k=0;
for(i=1;i<=n;++i) rank[sa[i]]=i;
for(i=0;i<n;h[rank[i++]]=k)
for(k?k--:0,j=sa[rank[i]-1];r[j+k]==r[i+k];++k);
}
void Da(int r[],int n,int m)
{
int i,j,p;
int *t,*x=wa,*y=wb;
for(i=0;i<m;++i) wn[i]=0;
for(i=0;i<n;++i) wn[x[i]=r[i]]++;
for(i=1;i<m;++i) wn[i]+=wn[i-1];
for(i=n-1;i>=0;--i)
sa[--wn[x[i]]]=i;
for(p=0,j=1;p<n;j<<=1,m=p)
{
for(p=0,i=n-j;i<n;++i) y[p++]=i;
for(i=0;i<n;++i) if(sa[i]>=j) y[p++]=sa[i]-j;
for(i=0;i<n;++i) wv[i]=x[y[i]];
for(i=0;i<m;++i) wn[i]=0;
for(i=0;i<n;++i) wn[wv[i]]++;
for(i=1;i<m;++i) wn[i]+=wn[i-1];
for(i=n-1;i>=0;--i)
sa[--wn[wv[i]]]=y[i];
p=1,t=x,x=y,y=t;
for(x[sa[0]]=0,i=1;i<n;++i)
x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
}
}
inline int LCP(int x,int y)
{
x=rank[x]+1;
y=rank[y]+1;
if(x>y) swap(x,y);
return rmq.query(x,y);
}
int R[maxn];
bool ok[maxn];
int main() {
int T,cas;
int k,u,v,w,i;
int n,m,s,len;
scanf("%d",&T);
for(cas=1;cas<=T;++cas)
{
memset(ok,true,sizeof(ok));
len=n=m=0;
scanf("%s",str);
n=strlen(str);
str[n]='$';
scanf("%s",str+n+1);
m=strlen(str+n+1);
len=n+m+1;
for(i=0;i<=len;++i) a[i]=(int)str[i];
Da(a,len+1,128);
Calheight(a,len);
rmq.n=len;
rmq.make(h);
for(i=0;i<=n-m;++i)
{
k=LCP(i,n+1);
if(k>=m)
{
ok[i+m-1]=false;
}
}
R[n-1]=n-1;
for(i=n-2;i>=0;--i)
{
if(!ok[i]) R[i]=i;
else R[i]=R[i+1];
}
ll ans=0;
Da(a,n+1,128);
Calheight(a,n);
int l,r;
for(i=1;i<=n;++i)
{
if(h[i]>=m&&!ok[sa[i]+m-1]) continue;
if(!ok[R[sa[i]]])
{
if(R[sa[i]]-sa[i]+1>=m&&R[sa[i]]<=sa[i]+h[i]) continue;
}
l=sa[i]+h[i];
r=min(sa[i]+m-1,n-1);
r=R[r];
if(!ok[r])
{
if(r-sa[i]+1>=m) r--;
}
r=min(r,n-1);
if(r>=l)
ans+=r-l+1;
}
printf("Case %d: %lld\n",cas,ans);
}
return 0;
}