题目:大致题意:给出一个字符串,求该字符串的子串能在该串中出现2次以上且不重叠的子串有几种
解题思路:不给原字符串末尾加一个比谁都小的数一直报错,我也是真的不太搞得懂。思路就是不断枚举长度,如果height[j]>=i,那就说明sa[j]和sa[j-1]之间的公共子串的长度高于所规定的的i长度,一定能够找出来长度为i的公共子串。
#include<cstdio>
#include<cstring>
#include<algorithm>
#include<iostream>
#define N 10009
using namespace std;
char s[N];
int sa[N],t1[N],t2[N],c[N],rnk[N],height[N],n,r[N];
void build_sa(int m)
{
int *x = t1, *y = t2;
for(int i=0; i<m; i++) c[i] = 0;
for(int i=0; i<n; i++) c[x[i] = r[i]]++;
for(int i=1;i<m;i++) c[i]+=c[i-1];//桶
for(int i=n-1;i>=0;i--) sa[--c[x[i]]]=i;
for(int k=1; k<=n; k = k<<1)
{
int p = 0;
//y是用来给第二关键字排序的
for(int i=n-k; i<n; i++) y[p++] = i; //后面几个第二关键字都没有,自然是最小的,排在前面
for(int i=0; i<n; i++) if(sa[i] >= k) y[p++] = sa[i]-k;//第二关键字的位置本来是sa[i],-k之后就变成它对应第一关键字的位置(直边所指)
for(int i=0; i<m; i++) c[i] = 0;//清空桶,要开始基数排序了
for(int i=0; i<n; i++) c[x[y[i]]]++;
for(int i=0; i<m; i++) c[i] += c[i-1];
for(int i=n-1; i>=0; i--) sa[--c[x[y[i]]]] = y[i];
swap(x,y);
p = 1; x[sa[0]] = 0;//从0开始赋值
for(int i=1; i<n; i++)//如果说第一关键字和第二关键字都和前面相同,那就给一个和前面一样的键值,否则就给一个新的更高的键值
x[sa[i]] = y[sa[i-1]] == y[sa[i]] && y[sa[i-1]+k] == y[sa[i]+k] ? p-1 : p++;
if(p >= n) break;//已经分出胜负了,各不相同
m = p;
}
}
void getheight()
{
int i,j,k = 0;
for(int i=0; i<n; i++) rnk[sa[i]] = i;
for(i = 0; i < n; i++)
{
if(k) k--;
if(rnk[i] == 0)
{
height[rnk[i]] = 0;
continue;
}
j = sa[rnk[i]-1];
while(s[i+k] == s[j+k]) k++;
height[rnk[i]] = k;
}
}
int main()
{
//freopen("t.txt","r",stdin);
while(scanf("%s",s)!=EOF)
{
if(s[0]=='#') break;
n=strlen(s);
for(int i=0;i<n;i++) r[i]=s[i]-'a'+1;
r[n]=0;//在后面加入一个比所有字符都小的,不然会报错,原因真不懂
n++;
build_sa(128);
getheight();
long long ans=0;
height[n]=0;
for(int i=1;i<=n/2+1;i++)
{
int mi=N,ma=-N;
for(int j=1;j<=n;j++)
{
if(height[j]>=i)
{
mi=min(mi,min(sa[j],sa[j-1]));
ma=max(ma,max(sa[j],sa[j-1]));
}else
{
if(mi!=N&&ma-mi>=i) ans++;
mi=N;
ma=-N;
}
}
}
printf("%lld\n",ans);
}
return 0;
}