题目链接:http://www.spoj.com/problems/DISUBSTR/
SPOJ 上还有一题,除了数据范围不一样其他的就都行:http://www.spoj.com/problems/SUBST1/
把下面程序的maxn改成60000就OK了!
第一次做spoj上的题目
这个题目还是利用height数组,表示后缀数组理解还是靠height数组的理解
这个题目其实思路还是不太容易想到的,但是一下想到了就会变的暴简单
开始排名第一的串先上,那么这个串一定会产生 n-sa[1]个前缀,也就是n-sa[1]个不同的子串
完成之后从第二个开始找
那么如果不考虑重复的话第二个会产生n-sa[2]个子串,但是和前面一定是重复了height[2]个,因为前面height个是重复的
接着就是排名第i个串一定会产生n-sa[i]+height[i]个和前面所有串都不相同的子串
然后把所有的结果全部加起来就是这个题目的答案
#include <iostream>
#include <stdio.h>
#include <algorithm>
#include <math.h>
#include <string.h>
using namespace std;
#define maxn 1100
#define ws ws1
int wa[maxn],wb[maxn],wv[maxn],ws[maxn];
int cmp(int *r,int a,int b,int l)
{return r[a]==r[b]&&r[a+l]==r[b+l];}
void da(char *r,int *sa,int n,int m)
{
int i,j,p,*x=wa,*y=wb,*t;
for(i=0;i<m;i++) ws[i]=0;
for(i=0;i<n;i++) ws[x[i]=r[i]]++;
for(i=1;i<m;i++) ws[i]+=ws[i-1];
for(i=n-1;i>=0;i--) sa[--ws[x[i]]]=i;
for(j=1,p=1;p<n;j*=2,m=p)
{
for(p=0,i=n-j;i<n;i++) y[p++]=i;
for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;
for(i=0;i<n;i++) wv[i]=x[y[i]];
for(i=0;i<m;i++) ws[i]=0;
for(i=0;i<n;i++) ws[wv[i]]++;
for(i=1;i<m;i++) ws[i]+=ws[i-1];
for(i=n-1;i>=0;i--) sa[--ws[wv[i]]]=y[i];
for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++)
x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
}
return;
}
int rank[maxn],height[maxn];
void calheight(char *r,int *sa,int n)
{
int i,j,k=0;
for(i=1;i<=n;i++) rank[sa[i]]=i;//在计算height的时候顺便就把rank计算出来了,反正也要用
for(i=0;i<n;height[rank[i++]]=k)
for(k?k--:0,j=sa[rank[i]-1];r[i+k]==r[j+k];k++);
return;
}
char rec[maxn];
int sa[maxn];
int n;
int find_ans(){
int i;
int ans=n-sa[1];
for(i=2;i<=n;i++)//从1开始,因为最小的是空串
{
ans+=n-sa[i]-height[i];
}
return ans;
}
int main()
{
int i,j,k;
int left,right;
int mid;
int t;
scanf("%d",&t);
while(t--)
{
scanf("%s",rec);
if(strcmp("#",rec)==0)
return 0;
n=strlen(rec);
da(rec,sa,n+1,200);//这里是n+1 因为看这个函数里面是 < n 的
calheight(rec,sa,n);//注意这里面是 n 了因为看函数里面是 <=n 的,所以这里要注意
if(n==1)
{
printf("1\n");
continue;
}
printf("%d\n",find_ans());
}
return 0;
}