URAL 1297 Palindrome(最长回文子串:后缀数组)
题意:
给你一个字符串,要你求出这个串中的最长回文字串,如果存在多个,则输出第一次出现的那个.
分析:
论文例题.
首先其实本题用manacher算法更为简单方便:
http://blog.csdn.net/u013480600/article/details/23060715
http://blog.csdn.net/u013480600/article/details/23062113
首先将原字符串逆序连接在原字符串后面,不过中间添加一个字符$,然后在新字符串尾加个0即可.
求sa和height数组.假设原字符串长n,从0到n-1,那么新字符串长2*n+2(因为加了$和尾0),且从0到2*n-1.
如上图所示,我们只需要从0到n-1位置枚举,看看以当前位置i为中心的奇数回文串和偶数回文串最长为多少即可.
对于奇数回文串:比较新串的后缀i和后缀2*n-i的最长公共前缀即可.
假设这个LCP=x,那么以i为中心的奇数最长回文串长度=x*2-1.(对应上图的情况1,自己仔细想想看看是不是).
对于偶数回文串:比较新串的后缀i和后缀2*n-i+1的最长公共前缀即可.
假设这个LCP=x,那么以i为中心的偶数最长回文串长度=x*2.(对应上图的情况2,自己仔细想想看看是不是).
下面的问题是:如何求出两个后缀的LCP呢?由刘汝佳的书可知,两个后缀i和j的LCP为(假设rank[i]<rank[j]):
LCP=min( height[rank[i]+1], height[rank[i]+2] ,…, height[rank[j]] )
=RMQ(rank[i]+1,rank[j]).
所以我们对height数组在范围[1 , 2*n+1]区间维护一个RMQ即可.(因为height[0]指的是尾0无意义,且RMQ一般是从1开始的)
注意:数组要开两倍大.
AC代码:
#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;
const int maxn=2000+100;
struct SuffixArray
{
char s[maxn];
int sa[maxn],rank[maxn],height[maxn];
int t1[maxn],t2[maxn],c[maxn],n;
int dmin[maxn][20];
void build_sa(int m)
{
int i,*x=t1,*y=t2;
for(i=0;i<m;i++) c[i]=0;
for(i=0;i<n;i++) c[x[i]=s[i]]++;
for(i=1;i<m;i++) c[i]+=c[i-1];
for(i=n-1;i>=0;i--) sa[--c[x[i]]]=i;
for(int k=1;k<=n;k<<=1)
{
int p=0;
for(i=n-k;i<n;i++) y[p++]=i;
for(i=0;i<n;i++)if(sa[i]>=k) y[p++]=sa[i]-k;
for(i=0;i<m;i++) c[i]=0;
for(i=0;i<n;i++) c[x[y[i]]]++;
for(i=1;i<m;i++) c[i]+=c[i-1];
for(i=n-1;i>=0;i--) sa[--c[x[y[i]]]] = y[i];
swap(x,y);
p=1,x[sa[0]]=0;
for(i=1;i<n;i++)
x[sa[i]]= y[sa[i]]==y[sa[i-1]]&&y[sa[i]+k]==y[sa[i-1]+k]? p-1:p++;
if(p>=n) break;
m=p;
}
}
void build_height()
{
int i,j,k=0;
for(i=0;i<n;i++)rank[sa[i]]=i;
for(i=0;i<n;i++)
{
if(k)k--;
j=sa[rank[i]-1];
while(s[i+k]==s[j+k])k++;
height[rank[i]]=k;
}
}
void initMin()
{
for(int i=1;i<=n;i++) dmin[i][0]=height[i];
for(int j=1;(1<<j)<=n;j++)
for(int i=1;i+(1<<j)-1<=n;i++)
dmin[i][j]=min(dmin[i][j-1] , dmin[i+(1<<(j-1))][j-1]);
}
int RMQ(int L,int R)//取得范围最小值
{
int k=0;
while((1<<(k+1))<=R-L+1)k++;
return min(dmin[L][k] , dmin[R-(1<<k)+1][k]);
}
int LCP(int i,int j)//求后缀i和j的LCP最长公共前缀
{
int L=rank[i],R=rank[j];
if(L>R) swap(L,R);
L++;
return RMQ(L,R);
}
}sa;
int main()
{
scanf("%s",sa.s);
int n=strlen(sa.s);
sa.n=2*n+2;
sa.s[n]=1;
for(int i=n+1;i<=2*n;i++)
sa.s[i]=sa.s[2*n-i];
sa.s[2*n+1]=0;
sa.build_sa(128);
sa.build_height();
sa.initMin();
int ans=1,pos=0;//最长回文字串长度和起始位置
for(int i=0;i<n;i++)
{
int lcp=sa.LCP(i,2*n-i);//奇数长度情况时
if(lcp*2-1>ans) {ans=lcp*2-1; pos=i-lcp+1;}
lcp=sa.LCP(i,2*n-i+1);//偶数长度情况时
if(lcp*2>ans) {ans=lcp*2; pos=i-lcp;}
}
sa.s[ans+pos]=0;
printf("%s\n",sa.s+pos);
return 0;
}