URAL 1297 Palindrome(后缀数组)
题意
给出一个字符串,找到它的最长回文子串。
解题思路
按照论文中说的,只需要将整个字符串反过来写在原串的后面,中间用一个特殊字符隔开,然后再求这个新字符串的最长公共前缀,然后只需要注意最小下标。但是这样并非完全正确,给出样例串zzdcddzz,那么它得到的串为zzdcddzz~zzddcdzz,这个数组一共有三处最大height[i],分别如下
1.第一组
dcddzz~zzddcdzz
dcdzz
这一组height[i]=3,min(sa[i],sa[i-1])=3,其实这一组就是正确答案
2.第二组
dzz
dzz~zzddcdzz
这一组height[i]=3,min(sa[i],sa[i-1])=6,这一组对原逻辑没什么影响
3.第三组
zzdcddzz~zzddcdzz
zzddcdzz
这一组height[i]=3,min(sa[i],sa[i-1])=1,问题就出在这一组,按照原逻辑是直接会将pos更新到1,那么得到的串为zzd,即如果字符串里后缀反过来可能与前缀匹配上,这就是bug所在。
为了解决这个bug,我在更新结果的时候,判了一下得到的串是否为回文串,效果目测还行。
代码
#include <cstdio>
#include <iostream>
#include <cstring>
#define LL long long
#define ULL unsigned long long
using namespace std;
const int maxn= 1e4+50;
int wa[maxn],wb[maxn],wv[maxn],wt[maxn];
int cmp(int *r,int a,int b,int l)
{
return r[a]==r[b]&&r[a+l]==r[b+l];
}
void da(char r[],int sa[],int n,int m)
{
int i,j,p,*x=wa,*y=wb,*t;
for(i=0; i<m; i++) wt[i]=0;
for(i=0; i<n; i++) wt[x[i]=r[i]]++;
for(i=1; i<m; i++) wt[i]+=wt[i-1];
for(i=n-1; i>=0; i--) sa[--wt[x[i]]]=i;
for(j=1,p=1; p<n; j*=2,m=p)
{
for(p=0,i=n-j; i<n; i++) y[p++]=i;
for(i=0; i<n; i++) if(sa[i]>=j) y[p++]=sa[i]-j;
for(i=0; i<n; i++) wv[i]=x[y[i]];
for(i=0; i<m; i++) wt[i]=0;
for(i=0; i<n; i++) wt[wv[i]]++;
for(i=1; i<m; i++) wt[i]+=wt[i-1];
for(i=n-1; i>=0; i--) sa[--wt[wv[i]]]=y[i];
for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1; i<n; i++)
x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
}
return;
}
int sa[maxn],rankk[maxn],height[maxn],n;
void getheight(char *r,int *sa,int n)
{
int i,j,k=0;
for(i=1; i<=n; i++) rankk[sa[i]]=i;
for(i=0; i<n; height[rankk[i++]]=k)
for(k?k--:0,j=sa[rankk[i]-1]; r[i+k]==r[j+k]; k++);
for(int i=n; i>=1; --i) ++sa[i],rankk[i]=rankk[i-1];
}
char arr[maxn],str[maxn];
int main()
{
#ifdef DEBUG
freopen("in.txt","r",stdin);
#endif // DEBUG
scanf("%s",str);
int n=strlen(str);
for(int i=0; i<n; i++) arr[i]=str[i];
arr[n]=(char)126;
for(int i=n+1,j=n-1; j>=0; i++,j--) arr[i]=str[j];
arr[n*2+1]='\0';
int len=n*2+1;
da(arr,sa,len+1,200);
getheight(arr,sa,len);
// for(int i=1;i<=len;i++)
// {
// for(int j=sa[i];j<=len;j++)
// printf("%c",arr[j-1]);
// printf("\n");
// }
int ans=1,pos=1;
for(int i=2; i<=len; i++)
{
if((sa[i]/n)^(sa[i-1]/n))
{
int sam=sa[i],sim=sa[i-1],flag=0;
if(sam<sim) swap(sam,sim);
for(int k=sim-1,j=sim+height[i]-2; k<j; k++,j--) //判断找到的串是否为回文串
if(arr[k]!=arr[j])
{
flag=1;
break;
}
if(flag) continue;
if(height[i]>ans) ans=height[i],pos=sim;
else if(height[i]==ans) pos=min(pos,sim);
}
}
for(int i=0; i<ans; i++) printf("%c",arr[i+pos-1]);
printf("\n");
return 0;
}