大致题意:给出一个字符串,求该字符串的子串能在该串中出现2次以上且不重叠的子串有几种
测试案例:
input:
aaaa
ababcabb
aaaaaa
#
output:
2
3
3
解题思路:这题我是用后缀数组做的,具体的后缀数组怎么生成我也不懂,是直接套模板的,这题我通过案例ababcabb这个字符串来讲下我的程序是怎么处理的。
首先,sa这个数组存的是后缀数组的位置,然后height这个数组height[i]存的是后缀数组suffix[sa[i]]与suffix[sa[i-1]]最长公共前缀的值,首先我们先将sa字符串末尾假装添上一个字符,反映在代码中就是让r[len]=0,便于计算sa数组,然后从字符串从头到尾遍历一遍,如果str[i]为‘a’那么r[i]为1,str[i]为'b'那么r[i]为2,以此类推,在通过da(r,sa,len+1,27)这个方法计算出sa的值,sa意义见表格:
sa | 数组下标 | 数组值 | 代表字符串 |
0 | 8 | ‘ababcabb | |
1 | 0 | ababcabb | |
2 | 5 | abb | |
3 | 2 | abcabb | |
4 | 7 | b | |
5 | 1 | babcabb | |
6 | 6 | bb | |
7 | 3 | bcabb | |
8 | 4 | c |
然后计算出后缀数组的公共前缀height数组:
height | 数组下标 | 数组值 | 公共前缀 |
0 | 0 |
| |
1 | 0 |
| |
2 | 2 | ab | |
3 | 2 | ab | |
4 | 0 |
| |
5 | 1 | b | |
6 | 1 | b | |
7 | 1 | b | |
8 | 0 |
|
代码:
#include <cstdio>
#include <cstring>
#include <algorithm>
using namespace std;
const int maxn=10010;
int wa[maxn],wb[maxn],wv[maxn],ws[maxn];
int ranks[maxn],height[maxn];
int cmp(int *r,int a,int b,int l)
{
return r[a]==r[b]&&r[a+l]==r[b+l];
}
void da(int *r,int *sa,int n,int m)
{
int i,j,p,*x=wa,*y=wb,*t;
for(i=0; i<m; i++) ws[i]=0;
for(i=0; i<n; i++) ws[x[i]=r[i]]++;
for(i=1; i<m; i++) ws[i]+=ws[i-1];
for(i=n-1; i>=0; i--) sa[--ws[x[i]]]=i;
for(p=1,j=1; p<n; j*=2,m=p)
{
for(p=0,i=n-j; i<n; i++) y[p++]=i;
for(i=0; i<n; i++) if(sa[i]>=j) y[p++]=sa[i]-j;
for(i=0; i<n; i++) wv[i]=x[y[i]];
for(i=0; i<m; i++) ws[i]=0;
for(i=0; i<n; i++) ws[wv[i]]++;
for(i=1; i<m; i++) ws[i]+=ws[i-1];
for(i=n-1; i>=0; i--) sa[--ws[wv[i]]]=y[i];
for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1; i<n; i++)
x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
}
return ;
}
void calheight(int *r,int *sa,int n)
{
int i,j,k=0;
for(i=1; i<=n; i++)ranks[sa[i]]=i;
for(i=0; i<n; height[ranks[i++]]=k)
for(k?k--:0,j=sa[ranks[i]-1]; r[i+k]==r[j+k]; k++);
return;
}
int main()
{
char str[1010];
int r[1010],sa[1010],i,j;
while (scanf("%s",str)==1)
{
if (str[0]=='#')
break;
int len=strlen(str);
for (i=0;i<len;i++)
{
r[i]=str[i]-'a'+1;
}
r[len]=0;
da(r,sa,len+1,27);
calheight(r,sa,len);
int minpos,maxpos,ans=0;
for (i=1;i<=len/2;i++)
{
minpos=10010;
maxpos=-1;
for (j=1;j<=len;j++)
{
if (height[j]>=i)
{
if (sa[j-1]<sa[j])
{
minpos=min(sa[j-1],minpos);
maxpos=max(sa[j],maxpos);
}
else
{
minpos=min(sa[j],minpos);
maxpos=max(sa[j-1],maxpos);
}
}
else
{
if (minpos+i<=maxpos)
ans++;
minpos=10010;
maxpos=-1;
}
}
if (minpos+i<=maxpos)
ans++;
}
printf("%d\n",ans);
}
return 0;
}