题意:给定一个字符串T,在T里面找出一个子串s使得子串s在T里面至少出现m次。输出最长字符串的长度和起始位置的最大值。(起始位置从0开始 )如果不存在输出“none”。
分析:如果一个比较长的子串在文本串T里面至少出现m次,那么一定存在一个比较短的子串至少出现m次。二分子串的长度L,然后得到所有的长度为L的子串的Hash值,统计Hash值出现的次数,判断L是否满足条件。
代码:
#include <iostream>
#include <cstdio>
#include <cstring>
#include <algorithm>
using namespace std;
typedef unsigned long long ULL;
const int maxn = 1e5+6;
const int seed = 131;
ULL H[maxn],x[maxn],Hash[maxn]; //
int m,Len,pos,Rank[maxn];
char str[maxn];
void Init()
{
int i,j;
Len=strlen(str);
H[Len]=0;
for(i=Len-1;i>=0;i--)
H[i]=H[i+1]*seed+str[i]-'a';
x[0]=1;
for(i=1;i<Len;i++)
x[i]=x[i-1]*seed;
}
bool cmp(int a,int b)
{
if(Hash[a]!=Hash[b])
return Hash[a]<Hash[b];
return a<b;
}
bool possible(int L)
{
int i,j,c;
pos=-1;
for(i=0;i<Len-L+1;i++)
{
Rank[i]=i;
Hash[i]=H[i]-H[i+L]*x[L];
}
sort(Rank,Rank+Len-L+1,cmp);
for(i=0;i<Len-L+1;i++)
{
if(!i || Hash[Rank[i]]!=Hash[Rank[i-1]])
c=0;
if(++c>=m && pos<Rank[i])
pos=Rank[i];
}
return pos>=0;
}
int main()
{
int i,j;
while(scanf("%d",&m)!=EOF&&m)
{
scanf("%s",str);
Init();
if(!possible(1))
{
printf("none\n");
continue ;
}
int down=1,up=Len,mid,ans=-1;
while(down<=up)
{
mid=(down+up)>>1;
if(possible(mid))
{
down=mid+1;
if(ans<mid)
ans=mid;
}
else
up=mid-1;
}
possible(ans);
printf("%d %d\n",ans,pos);
}
return 0;
}