//出现两次及以上不重复的概率 //枚举长度,通过height值判断每组中是否可能 #include<stdio.h> #include<string.h> #include<algorithm> using namespace std; const int maxn=20005; //以下为倍增算法求后缀数组 int wa[maxn],wb[maxn],wv[maxn],Ws[maxn]; int cmp(int *r,int a,int b,int l) {return r[a]==r[b]&&r[a+l]==r[b+l];} void da(const int *r,int *sa,int n,int m){ int i,j,p,*x=wa,*y=wb,*t; for(i=0;i<m;i++) Ws[i]=0; for(i=0;i<n;i++) Ws[x[i]=r[i]]++; for(i=1;i<m;i++) Ws[i]+=Ws[i-1]; for(i=n-1;i>=0;i--) sa[--Ws[x[i]]]=i; for(j=1,p=1;p<n;j*=2,m=p){ for(p=0,i=n-j;i<n;i++) y[p++]=i; for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j; for(i=0;i<n;i++) wv[i]=x[y[i]]; //x[]->上次排序的排名 for(i=0;i<m;i++) Ws[i]=0; for(i=0;i<n;i++) Ws[wv[i]]++; for(i=1;i<m;i++) Ws[i]+=Ws[i-1]; for(i=n-1;i>=0;i--) sa[--Ws[wv[i]]]=y[i]; //y[i]->二级排序后第i大的下标,循环从n-1到0由于一级排序相同要看二级排序 for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++) x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++; } return; } int sa[maxn],Rank[maxn],height[maxn]; //求height数组 //sa[1,n]取值范围[0,n-1],sa[0]为特殊字符 //Rank[0,n-1]取值范围[1,n] //height[1,n]表示排名相邻的两个后缀的最长公共前缀 //height[i]表示sa[i]和sa[i-1]的最长前缀 排名为i与i-1的最长公共前缀 void calheight(const int *r,int *sa,int n){ int i,j,k=0; for(i=1;i<=n;i++) Rank[sa[i]]=i; for(i=0;i<n;height[Rank[i++]]=k) for(k?k--:0,j=sa[Rank[i]-1];r[i+k]==r[j+k];k++); return; } /* da(r,sa,n+1,128); n+1表示加入特殊字符后的长度[0,n]; calheight(r,sa,n); 去掉特殊字符[1,n]长度,就是输入字符串长度n */ char b[maxn]; int a[maxn]; int Gao(int m,int n){ int i,j,k; int flag=0; int max=sa[0]; int min=sa[0]; for(i=1;i<=n;i++){ if(height[i]>=m){ if(sa[i]>max)max=sa[i]; if(sa[i]<min)min=sa[i]; }else{ if(max-min>=m) flag++; max=sa[i]; min=sa[i]; } } if(max-min>=m)flag++; return flag; } int main(){ int n,m; int i,j,k; while(scanf("%s",b) && strcmp(b,"#")){ n=strlen(b); for(i=0;i<n;i++) a[i]=b[i]-'a'+1; a[n]=0; da(a,sa,n+1,30); calheight(a,sa,n); int ans=0; for(i=1;i<=n/2;i++) ans+=Gao(i,n); printf("%d\n",ans); } return 0; } //借鉴cxlove
Boring counting HDU 3518
最新推荐文章于 2021-03-17 10:02:18 发布