题意:给定一个字符串,求出不重复且出现过至少两次的子串个数;
思路: 典型的后缀数组题,只是比赛中没考虑到时间,以为O(n^2)觉得爆,没看到时间是10s,唉。。
就是后缀后,枚举子串可能的长度,对 height[] 分组,维护长度一定时改子串的起点的最大,最小值;
如果 (max-min>= k) ,就是ans++; 总是以后做题必定考虑下时间效率;
#include <vector>
#include <list>
#include <map>
#include <set>
#include <deque>
#include <queue>
#include <stack>
#include <bitset>
#include <algorithm>
#include <functional>
#include <numeric>
#include <utility>
#include <sstream>
#include <iostream>
#include <iomanip>
#include <cstdio>
#include <cmath>
#include <cstdlib>
#include <cctype>
#include <string>
#include <cstring>
#include <ctime>
using namespace std;
const int maxn=10010;
char s[maxn];
int sa[maxn],t[maxn],t2[maxn],c[maxn],n;
void build_sa(int n,int m)
{
int i,*x=t,*y=t2;
//基数排序
for(i=0;i<m;i++) c[i]=0;
for(i=0;i<n;i++) c[x[i]=s[i]]++;
for(i=1;i<m;i++) c[i]+=c[i-1];
for(i=n-1;i>=0;i--) sa[--c[x[i]]]=i;
for(int k=1;k<=n;k<<=1)
{
int p=0;
//直接利用sa数组排序第二关键字
for(i=n-k;i<n;i++) y[p++]=i;
for(i=0;i<n;i++)
if(sa[i]>=k) y[p++]=sa[i]-k;
for(i=0;i<m;i++) c[i]=0;
for(i=0;i<n;i++) c[x[y[i]]]++;
for(i=0;i<m;i++) c[i]+=c[i-1];
for(i=n-1;i>=0;i--) sa[--c[x[y[i]]]]=y[i];
swap(x,y);
p=1;x[sa[0]]=0;
for(i=1;i<n;i++)
x[sa[i]]=y[sa[i-1]]==y[sa[i]]&&y[sa[i-1]+k]==y[sa[i]+k]?p-1:p++;
if(p>=n) break;
m=p;
}
}
//LCP
int ra[maxn],height[maxn];
void getHeight(int n)
{
int i,j,k=0;
for(i=0;i<=n;i++) ra[sa[i]]=i;
for(i=0;i<n;i++)
{
if(k) k--;
int j=sa[ra[i]-1];
while(s[i+k]==s[j+k]) k++;
height[ra[i]]=k;
}
}
long long sum;
void calc(int n)
{
int Max,Min;
for(int len=1;len<=n/2;len++)
{
Max=Min=sa[1];
for(int i=2;i<=n+1;i++)
{
if(height[i]<len || i==n+1) //不满足是计算
{
if(Max-Min>=len) sum++;
Max=Min=sa[i];
}
else //更新max,min
{
Max=max(Max,sa[i]);
Min=min(Min,sa[i]);
}
}
}
}
int main()
{
while(~scanf("%s",s))
{
int n=strlen(s);
build_sa(n+1,200);
getHeight(n);
sum=0;
calc(n);
cout<<sum<<endl;
}
return 0;
}