题意:
给你一个字符串,问你其中有多少连续出现k次的子串,计算时不可区间重复
题解:
有点难的题目,重要的是想到两个点:
1.当已经有连续的大于等于k次子串的时候,后面的字符串与前面的最长公共前缀 也要算入答案,比如说ababac,k=2。
ab出现了两次,ac与ab的最长公共前缀为a,那么答案就要再加1,因为ba也算。
然后接下来的起始位置就是当前找到的最后的位置在减去当前位置和起始位置的最长公共后缀,比如说起始串为aaaa,当前找到了bbaa,那么接下来的起始位置就是当前位置-2,因为后面可能有连续的a。
那么我们就枚举长度,然后做
n
n
n\sqrt{n}
nn即可,找前后缀只需要二分即可。
#include<bits/stdc++.h>
using namespace std;
#define ll unsigned long long
#define pa pair<ll,ll>
const int N=3e5+5;
pa p[N],h[N];
pa get_h(int l,int r)
{
ll h1=h[r].first-(l>0?h[l-1].first*p[r-l+1].first:0ll);
ll h2=h[r].second-(l>0?h[l-1].second*p[r-l+1].second:0ll);
return (pa){h1,h2};
}
char s[N];
int get_pre(int p1,int p2,int len)
{
int l=0,r=len,mid,ans;
while(r>=l)
{
mid=l+r>>1;
pa a=get_h(p1,p1+mid-1),b=get_h(p2,p2+mid-1);
if(a.first==b.first&&a.second==b.second)
ans=mid,l=mid+1;
else
r=mid-1;
}
return ans;
}
int get_suf(int p1,int p2,int len)
{
int l=0,r=len,mid,ans;
while(r>=l)
{
mid=l+r>>1;
pa a=get_h(p1-mid+1,p1),b=get_h(p2-mid+1,p2);
if(a.first==b.first&&a.second==b.second)
ans=mid,l=mid+1;
else
r=mid-1;
}
return ans;
}
int main()
{
p[0].first=p[0].second=1;
for(int i=1;i<N;i++)
p[i].first=p[i-1].first*23ll,p[i].second=p[i-1].second*29ll;
int t;
scanf("%d",&t);
while(t--)
{
int k,len;
scanf("%d",&k);
scanf("%s",s);
len=strlen(s);
for(int i=0;i<len;i++)
{
h[i].first=(i>0?h[i-1].first*23ll:0ll)+(ll)s[i];
h[i].second=(i>0?h[i-1].second*29ll:0ll)+(ll)s[i];
}
if(k==1)
{
printf("%llu\n",(ll)(len+1)*len/2);
continue;
}
ll ans=0;
for(int l=1;l<=len/k;l++)
{
int p=l,last=0,cnt=1;
pa hs=get_h(0,l-1);
while(p<len)
{
if(l+p-1<len)
{
pa now=get_h(p,l+p-1);
if(now.first==hs.first&&now.second==hs.second)
{
cnt++;
p+=l;
}
else
{
int le=get_pre(last,p,l),rig=get_suf(last+l-1,p+l-1,l);
if(cnt>=k)
ans+=(ll)cnt*l+le-k*l+1;
last=p-rig,p=last+l,cnt=1;
hs=get_h(last,last+l-1);
}
}
else
{
int le=get_pre(p-l,p,len-p);
if(cnt>=k)
ans+=(ll)cnt*l+le-k*l+1;
cnt=0;
break;
}
}
if(cnt>=k)
ans+=(ll)cnt*l-k*l+1;
}
printf("%llu\n",ans);
}
return 0;
}
/*
1
2
abababab
*/