题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=2457
这道题用不到query函数,直接在带fail的字典树上面进行dp。
明确两点:
①:所有串insert之后builfail会将所有next=-1的指针指向根节点
②:正常查询时若查到一个有标记值的点,需要不断向上遍历fail节点,因为fail是其最长后缀,其出现则其后缀也一定出现。
但这道题中不需要用query,所以可以更接近底层的将每个点的标记值传给以它为fail的节点,这个操作在buildfail中bfs的时候可以顺便实现。
其次就是dp,dp【i】【j】代表当前写了i个字符,到达了字典树的第j个节点。假如对一个节点j,其有next节点k,则更新:
dp[i][k]=min(dp[i][k],dp[i-1][j]+(change_int(no[i])==k))
(其中no为匹配串,即这道题中的原DNA串,change_int用来将A、C、G、T转化成0~3的数字)
最后dp【len】【i】中的最小值,i是字典树节点集合。若其依旧为最开始初始化的值(inf),说明不可修改为正确DNA,输出-1。否则输出其值。
#include<bits/stdc++.h>
int inf;
using namespace std;
const int maxn=20+10;///多个模式串长度
const int N=1000+10;///文章长度
const int lettersize=4;///看种类
char s[maxn];
char no[N];
int pin(char x)
{
switch(x)
{
case 'A':return 0;
case 'C':return 1;
case 'G':return 2;
case 'T':return 3;
}
return 0;
}
const int MAX=1e6+10;
int dp[1010][1010];
struct Trie
{
int next[MAX][lettersize],fail[MAX],end[MAX];
int root,L;///root为根 L为点数
int newnode()
{
for (int i=0;i<lettersize;i++)
next[L][i]=-1;
end[L++]=0;
return L-1;
}
void init()
{
L=0;
root=newnode();
memset(dp,1,sizeof dp);
inf = dp[0][0];
}
void insert(char *buf)
{
int len=strlen(buf);
int now=root;
for (int i=0;i<len;i++)
{
int pos=pin(buf[i]);
if (next[now][pos]==-1)
next[now][pos]=newnode();
now=next[now][pos];
}
end[now]++;
}
void build ()
{
queue<int >Q;
fail[root]=root;
for (int i=0;i<lettersize;i++)
if (next[root][i]==-1)
next[root][i]=root;
else
{
fail[next[root][i]]=root;
Q.push(next[root][i]);
}
while (!Q.empty())
{
int now=Q.front();
Q.pop();
if(end[fail[now]])
end[now]=1;
for (int i=0;i<lettersize;i++)
if (next[now][i]==-1)
next[now][i]=next[fail[now]][i];
else
{
fail[next[now][i]]=next[fail[now]][i];
Q.push(next[now][i]);
}
}
}
}ac;
int main()
{
// freopen("1.txt","r",stdin);
// freopen("3.txt","w",stdout);
int t=1;
int n;
while(~scanf("%d",&n))
{
if(n==0)
break;
ac.init();
for(int i=1;i<=n;i++)
scanf("%s",s),ac.insert(s);
ac.build();
scanf("%s",no+1);
int len=strlen(no+1);
dp[0][0]=0;
for(int i=1;i<=len;i++)
{
for(int j=0;j<ac.L;j++)
{
if(dp[i-1][j]==inf)
continue;
for(int k=0;k<4;k++)
{
int son=ac.next[j][k];
if(ac.end[son]!=0)
continue;
dp[i][son]=min(dp[i][son],dp[i-1][j]+(pin(no[i])!=k));
}
}
}
// for(int i=1;i<=len;i++)
// for(int j=0;j<ac.L;j++)
// printf("dp[%d][%d]=%d\n",i,j,dp[i][j]);
//for(int i=0;i<ac.L;i++)
// for(int j=1;j<=3;j++)
// printf("next[%d][%d]=%d\n",i,j,ac.next[i][j]);
//for(int i=0;i<ac.L;i++)
// printf("end[%d]=%d\n",i,ac.end[i]);
int ans=inf;
for(int i=0;i<ac.L;i++)
if(!ac.end[i])
ans=min(ans,dp[len][i]);
if(ans==inf)
printf("Case %d: -1\n",t++);
else
printf("Case %d: %d\n",t++,ans);
}
return 0;
}