求最长可重叠重复次数大于等于k的子串长度:
两个方法:
字符串hash+二分答案,其实比后缀数组好写多了…(map会被卡,POJ还不支持unordered_map好像,所以只能记录然后排序再计算)
AC代码:
#include <cstdio>
#include <cstring>
#include <algorithm>
using namespace std;
typedef unsigned long long ULL;
typedef long long LL;
const ULL base=2333;
const int maxn=2e4+10;
int hash1[maxn];
int bin1[maxn];
int n,k;
ULL get_s(int left,int right)
{
return hash1[right]-hash1[left-1]*bin1[right-left+1];
}
bool check(int len)
{
ULL rec[maxn];memset(rec,0,sizeof(rec));
for(int i=1;i+len-1<=n;i++){
rec[i]=get_s(i,i+len-1);
}
sort(rec+1,rec+n-len+1);
int ans=1;
for(int i=2;i<=n-len+1;i++){
if(rec[i]==rec[i-1]) ++ans;
else ans=1;
if(ans>=k) return true;
}
return false;
}
void solve()
{
int left=1,right=n;
int ans=0;
while(left<=right){
int mid=(left+right)>>1;
if(check(mid)) left=mid+1,ans=mid;
else right=mid-1;
}
printf("%d\n",ans);
}
int main()
{
while(scanf("%d%d",&n,&k)!=EOF){
ULL S=0;bin1[0]=1;
for(int i=1;i<=n;i++){
int num;scanf("%d",&num);
S=S*base+num;
hash1[i]=S;
bin1[i]=bin1[i-1]*base;
}
solve();
}
}
后缀数组+二分答案:(做了几道题就发现其实很套路)
这个就需要height数组根据是否大于等于我们的待测答案进行分组,然后我们看组内元素最多能不能大于k-1,如果成立就说明该解可行。
#include <cstdio>
#include <cstring>
#include <algorithm>
using namespace std;
const int maxn=1e6+10;
int s[maxn];
int y[maxn],x[maxn],cnt[maxn],sa[maxn],rk[maxn],height[maxn];
int n,m;
int k;
void get_SA()
{
memset(cnt,0,sizeof(cnt));
m=300;
for (int i=1;i<=n;++i) ++cnt[x[i]=s[i]];
//x[i]是第i个元素的第一关键字
for (int i=2;i<=m;++i) cnt[i]+=cnt[i-1];
for (int i=n;i>=1;--i) sa[cnt[x[i]]--]=i;
for (int k=1;k<=n;k<<=1)
{
int num=0;
for (int i=n-k+1;i<=n;++i) y[++num]=i;
//y[i]表示第二关键字排名为i的数,第一关键字的位置
for (int i=1;i<=n;++i) if (sa[i]>k) y[++num]=sa[i]-k;
for (int i=1;i<=m;++i) cnt[i]=0;
for (int i=1;i<=n;++i) ++cnt[x[i]];
for (int i=2;i<=m;++i) cnt[i]+=cnt[i-1];//第一关键字排名为1~i的数有多少个
for (int i=n;i>=1;--i) sa[cnt[x[y[i]]]--]=y[i],y[i]=0;
swap(x,y);
x[sa[1]]=1;num=1;
for (int i=2;i<=n;++i)
x[sa[i]]=(y[sa[i]]==y[sa[i-1]] && y[sa[i]+k]==y[sa[i-1]+k]) ? num : ++num;
if (num==n) break;
m=num;
}
}
void get_height()
{
int k=0;
for (int i=1;i<=n;++i) rk[sa[i]]=i;
for (int i=1;i<=n;++i)
{
if (rk[i]==1) continue;//第一名height为0
if (k) --k;//h[i]>=h[i-1]+1;
int j=sa[rk[i]-1];
while (j+k<=n && i+k<=n && s[i+k]==s[j+k]) ++k;
height[rk[i]]=k;//h[i]=height[rk[i]];
}
}
bool check(int len)
{
int c=0;
for(int i=2;i<=n;i++){
if(height[i]>=len) c++;
else c=0;
if(c+1>=k) return true;
}
return false;
}
void solve()
{
int left=0,right=n;
int ans=0;
while(left<=right){
int mid=(left+right)>>1;
if(check(mid)) left=mid+1,ans=mid;
else right=mid-1;
}
printf("%d\n",ans);
}
int main()
{
while(scanf("%d%d",&n,&k)!=EOF){
for(int i=1;i<=n;i++) scanf("%d",&s[i]),s[i]++;
//字符串中字符要大于0,因为SA求解时自动当空位为0来进行比较的
get_SA();
get_height();
solve();
}
}