bzoj4044 [Cerc2014] Virus synthesis
原题地址:http://www.lydsy.com/JudgeOnline/problem.php?id=4044
题意:
你要用ATGC四个字母用两种操作拼出给定的串:
1.将其中一个字符放在已有串开头或者结尾
2.将已有串复制,然后reverse,再接在已有串的头部或者尾部
一开始已有串为空。求最少操作次数。
数据范围
len<=100000
题解:
摘论文:
注意到第二种操作后的字符串必然是一个回文串,考虑枚举s的一个回文子串s[i…j],
求出构造出s[i…j]的最小代价,用其加上i-1 + n-j来更新答案即可。建出s的回文树,现
在要求出构造出每个节点的最小代价。从短到长地计算每个回文串的代价。对于一个回
文串t,首先考虑第一种操作,可以从t的最长回文前(后)缀扩展出t,或从t的父亲扩展
出t,两种方案的代价都可直接计算。考虑通过第二种操作得到t,首先t的长度必须为偶数,
令t = bb r ,求出b的最长回文前(后)缀c,那么t的代价就是c的代价加上c扩展成b的代价再
加1。直接套用5.2中的算法,求出half t 后即可得到c。
总时间复杂度为O(n)。
而这个求half的复杂度:
令j为i在回文树上的父亲。hal fi必然是hal f j的某个回文后缀的儿子。直接沿着half j
的fail链找到第一个合法的节点。可以用与证明基础插入算法复杂度相同的方法证
明这种算法的总复杂度是O(|s|)。
对于len为偶数的转移是挺有意思的:
可证最后一步一定是翻转
1、从缩回两侧字符的状态转移。翻之后在两侧加,就是翻转之前在一侧加。 cSSc就是从S->Sc翻转过来,
dp[now]=dp[fa]+1
2、从包含最右字符的状态转移。先加再翻转。SccS就是从 S->cS翻转过来。
dp[now]=(len[now]/2−len[hf]+dp[hf])+1
注意长度为2的dp值就只是2了。
实际上我关于len为奇数的转移也写得冗余了,因为其实奇数len的dp值并没有用。
如果是奇数,最后一步一定不是翻转,而是首尾加,那么可以被上一次翻转之时的那个偶长度节点的贡献覆盖。
代码:
#include<cstdio>
#include<iostream>
#include<algorithm>
#include<cstring>
using namespace std;
const int N=100010;
int T,ch[N][4],s[N],len[N],fail[N],hf[N],tail=0,last,ts[128],n=0,ans=N,dp[N];
char str[N];
void mem(int x){for(int i=0;i<4;i++) ch[x][i]=0;}
void init() {tail=1; len[0]=0; len[1]=-1; fail[0]=1; last=0; s[0]=-1; n=0; ans=N; mem(0); mem(1);}
void insert(int c)
{
int tmp=last; s[++n]=c;
while(s[n-len[tmp]-1]!=s[n]) {tmp=fail[tmp];}
if(!ch[tmp][c])
{
int nd=++tail; mem(nd); len[nd]=len[tmp]+2; dp[nd]=len[nd];
int f=fail[tmp]; while(s[n-len[f]-1]!=s[n]) f=fail[f];
fail[nd]=ch[f][c];
if(len[nd]<=2) hf[nd]=fail[nd];
else {f=hf[tmp]; while(s[n-len[f]-1]!=s[n]||2*(len[f]+2)>len[nd]) f=fail[f]; hf[nd]=ch[f][c];}
ch[tmp][c]=nd;
if((len[nd]&1)==0) {dp[nd]=min(dp[nd],dp[hf[nd]]+(len[nd]/2-len[hf[nd]])+1); if(tmp>=2) dp[nd]=min(dp[nd],dp[tmp]+1);}
else dp[nd]=min(dp[nd],min(len[nd]-len[fail[nd]]+dp[fail[nd]],dp[tmp]+2)); //其实长度为奇数的没有必要。
}
last=ch[tmp][c];
}
int main()
{
scanf("%d",&T); ts['A']=0; ts['T']=1; ts['C']=2; ts['G']=3;
while(T--)
{
init(); scanf("%s",str); int l=strlen(str);
for(int i=0;i<l;i++) insert(ts[str[i]]);
for(int i=2;i<=tail;i++) ans=min(ans,l-len[i]+dp[i]);
printf("%d\n",ans);
}
return 0;
}