题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=6194
题意
给你一个字符串,要你求出这个字符串中正好出现k次的子串的个数有多少个。
花了很长一段时间,因为发现板子好像错了,找了好久的bug,就当现在又更新了一遍板子...
做法:
我们要找连续出现k次的,肯定是从sa数组下手,因为sa[i]数组记录的是字典序为i的串的下标,会连续出现k次的字符串在sa中肯定会是一段长度为k的区间中有公共的前缀,这里用到的lcp就能在O(1)的时间内求区间内最长公共前缀的长度,如果在i~k+i-1的区间内发现最长公共长度为L,那么我们就有L个不同的子串出现了至少k次(以同一个开头开始)
因为题目要求是正好k次,所以我们要减去至少出现了k+1次的子串的个数,那么我们就能用当前的区间内的l-1,和r+1下手,也就是,但是很明显,会有一些部分被多减了,这个时候我们就要再加上
就好啦。
#include<bits/stdc++.h>
typedef long long ll;
using namespace std;
const int maxn=100010;
//以下为倍增算法求后缀数组
int wa[maxn],wb[maxn],wv[maxn],Ws[maxn];
int t1[maxn],t2[maxn],c[maxn];
int sa[maxn],Rank[maxn],height[maxn];
int cmp(int *r,int a,int b,int l)
{return r[a]==r[b]&&r[a+l]==r[b+l];}
/**< 传入参数:str,sa,len+1,ASCII_MAX+1 */
void da( int r[],int n,int m)
{
int i,j,p,*x=wa,*y=wb,*t;
for(i=0; i<m; i++) Ws[i]=0;
for(i=0; i<n; i++) Ws[x[i]=r[i]]++;//以字符的ascii码为下标
for(i=1; i<m; i++) Ws[i]+=Ws[i-1];
for(i=n-1; i>=0; i--) sa[--Ws[x[i]]]=i;
for(j=1,p=1; p<n; j*=2,m=p)
{
for(p=0,i=n-j; i<n; i++) y[p++]=i;
for(i=0; i<n; i++) if(sa[i]>=j) y[p++]=sa[i]-j;
for(i=0; i<n; i++) wv[i]=x[y[i]];
for(i=0; i<m; i++) Ws[i]=0;
for(i=0; i<n; i++) Ws[wv[i]]++;
for(i=1; i<m; i++) Ws[i]+=Ws[i-1];
for(i=n-1; i>=0; i--) sa[--Ws[wv[i]]]=y[i];
for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1; i<n; i++)
x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
}
return;
}
void getHeight(int s[],int n)
{
int i,j,k=0;
for(i=0;i<=n;i++)Rank[sa[i]]=i;
for(i=0;i<n;i++)
{
if(k)k--;
j=sa[Rank[i]-1];
while(s[i+k]==s[j+k])k++;
height[Rank[i]]=k;
}
}
//求height数组
/**< str,sa,len */
//height[i]表示,第i与第i-1小的后缀的公共前缀的长度
//sa[i]表示为按照从小到大排名为i的后缀 是以j(下标)开头的后缀
//rank[i]表示,以下标 i 开头的后缀在所有后缀中从小到大排列的 “ 名次 ” 。
//注意!输入从第0开始,但是height从1~len
char str[maxn];
int aim[maxn],n,k;
int dp[maxn][30];
void Lcp_init(){
for(int i=1; i<=n+1; i++) dp[i][0] = height[i];
for(int j=1; (1<<j)<=n+1; j++){
for(int i=0; i+(1<<j)<n+2; i++){
dp[i][j] = min(dp[i][j-1], dp[i+(1<<(j-1))][j-1]);
}
}
}
ll lcp(int l, int r){
if(l == r) return n - sa[r];
if(l>r) swap(l, r);
++l;
int k=0,len=r-l+1;
while((1<<(k+1))<=len) ++k;
return min(dp[l][k], dp[r-(1<<k)+1][k]);
}
int main(){
int t;
cin>>t;
while(t--){
scanf("%d%s",&k,str);
n=strlen(str);
for(int i=0;i<n;i++) aim[i]=str[i]-'a'+1;
aim[n]=0;
da(aim,n+1,128);
getHeight(aim,n);
Lcp_init();
ll ans=0;
for(int i=1;i+k-1<=n;i++){
ans+=lcp(i,i+k-1);
if(i-1>0) ans-=lcp(i-1,i+k-1);
if(i+k<=n) ans-=lcp(i,i+k);
if(i-1>0 && i+k<=n) ans+=lcp(i-1,i+k);
}
printf("%lld\n",ans);
}
return 0;
}