bzoj4044 [Cerc2014] Virus synthesis（回文自动机 DP）

最新推荐文章于 2020-01-02 14:02:00 发布

Bfk_

最新推荐文章于 2020-01-02 14:02:00 发布

阅读量417

点赞数

分类专栏： DP ---------------字符串回文自动机题解思维题 bzoj 文章标签：字符串动态规划 bzoj 回文树回文自动机

本文链接：https://blog.csdn.net/Bfk_zr/article/details/79111313

版权

题解同时被 3 个专栏收录

150 篇文章 0 订阅

订阅专栏

bzoj

83 篇文章 0 订阅

订阅专栏

思维题

53 篇文章 0 订阅

订阅专栏

bzoj4044 [Cerc2014] Virus synthesis

原题地址：http://www.lydsy.com/JudgeOnline/problem.php?id=4044

题意：
你要用ATGC四个字母用两种操作拼出给定的串：
1.将其中一个字符放在已有串开头或者结尾
2.将已有串复制，然后reverse，再接在已有串的头部或者尾部
一开始已有串为空。求最少操作次数。

数据范围
len<=100000

题解：

摘论文：

注意到第二种操作后的字符串必然是一个回文串，考虑枚举s的一个回文子串s[i…j]，
求出构造出s[i…j]的最小代价，用其加上i-1 + n-j来更新答案即可。建出s的回文树，现
在要求出构造出每个节点的最小代价。从短到长地计算每个回文串的代价。对于一个回
文串t，首先考虑第一种操作，可以从t的最长回文前（后）缀扩展出t，或从t的父亲扩展
出t，两种方案的代价都可直接计算。考虑通过第二种操作得到t，首先t的长度必须为偶数，
令t = bb $^r$ ，求出b的最长回文前（后）缀c，那么t的代价就是c的代价加上c扩展成b的代价再
加1。直接套用5.2中的算法，求出half $_t$ 后即可得到c。
总时间复杂度为O(n)。

而这个求half的复杂度：

令j为i在回文树上的父亲。hal fi必然是hal f j的某个回文后缀的儿子。直接沿着half $_j$
的fail链找到第一个合法的节点。可以用与证明基础插入算法复杂度相同的方法证
明这种算法的总复杂度是O(|s|)。

对于len为偶数的转移是挺有意思的：
可证最后一步一定是翻转
1、从缩回两侧字符的状态转移。翻之后在两侧加，就是翻转之前在一侧加。 cSSc就是从S->Sc翻转过来，
$dp[now]=dp[fa]+1$
2、从包含最右字符的状态转移。先加再翻转。SccS就是从 S->cS翻转过来。
$dp[now]=(len[now]/2-len[hf]+dp[hf])+1$

注意长度为2的dp值就只是2了。

实际上我关于len为奇数的转移也写得冗余了，因为其实奇数len的dp值并没有用。
如果是奇数，最后一步一定不是翻转，而是首尾加，那么可以被上一次翻转之时的那个偶长度节点的贡献覆盖。

代码：

#include<cstdio>
#include<iostream>
#include<algorithm>
#include<cstring>
using namespace std;
const int N=100010;
int T,ch[N][4],s[N],len[N],fail[N],hf[N],tail=0,last,ts[128],n=0,ans=N,dp[N];
char str[N];
void mem(int x){for(int i=0;i<4;i++) ch[x][i]=0;}
void init() {tail=1; len[0]=0; len[1]=-1; fail[0]=1; last=0; s[0]=-1; n=0; ans=N; mem(0); mem(1);}

void insert(int c)
{
    int tmp=last; s[++n]=c;
    while(s[n-len[tmp]-1]!=s[n]) {tmp=fail[tmp];}
    if(!ch[tmp][c])
    {
        int nd=++tail; mem(nd); len[nd]=len[tmp]+2; dp[nd]=len[nd];
        int f=fail[tmp]; while(s[n-len[f]-1]!=s[n]) f=fail[f];
        fail[nd]=ch[f][c];
        if(len[nd]<=2) hf[nd]=fail[nd];
        else {f=hf[tmp]; while(s[n-len[f]-1]!=s[n]||2*(len[f]+2)>len[nd]) f=fail[f]; hf[nd]=ch[f][c];}
        ch[tmp][c]=nd;
        if((len[nd]&1)==0) {dp[nd]=min(dp[nd],dp[hf[nd]]+(len[nd]/2-len[hf[nd]])+1); if(tmp>=2) dp[nd]=min(dp[nd],dp[tmp]+1);}
        else dp[nd]=min(dp[nd],min(len[nd]-len[fail[nd]]+dp[fail[nd]],dp[tmp]+2)); //其实长度为奇数的没有必要。 
    }
    last=ch[tmp][c];
}
int main()
{
    scanf("%d",&T); ts['A']=0; ts['T']=1; ts['C']=2; ts['G']=3;
    while(T--)
    {
        init(); scanf("%s",str); int l=strlen(str);
        for(int i=0;i<l;i++) insert(ts[str[i]]);
        for(int i=2;i<=tail;i++) ans=min(ans,l-len[i]+dp[i]);
        printf("%d\n",ans);
    }
    return 0;
}

Bfk_

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
bzoj4044 [Cerc2014] Virus synthesis（回文自动机 DP）

bzoj4044 [Cerc2014] Virus synthesis原题地址：http://www.lydsy.com/JudgeOnline/problem.php?id=4044题意：你要用ATGC四个字母用两种操作拼出给定的串： 1.将其中一个字符放在已有串开头或者结尾 2.将已有串复制，然后reverse，再接在已有串的头部或者尾部一开始已有串为空。求最少操作次
复制链接

扫一扫