题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=2457
解题思路:
给出n个病毒串,一个基因串,询问基因串中最少修改多少个字符可以获得不包含任何一个病毒的串。
AC自动机用于 判断当前节点枚举子节点时候后缀是否会形成病毒串
DP的思路:
定义:dp[i][j]表示长度为i,终点在j节点的最小修改次数
初始化:dp[0][0] = 0,else dp = INF(一个很大的数)
状态转移:
当前状态可转移到下一状态的前提:当前节点枚举子节点后 后缀不存在完整单词(子节点不是单词末尾且子节点fail链上也无)
在上面的前提下,分两种情况:
设u表示当前节点,l表示当前长度,v表示子节点,c表示子节点对应字母,然后s表示基因串第l+1位字符
什么时候当前状态不可以用于转移:
当前dp[i][j] = INF
如果当前dp[i][j] = INF,这个节点j在当前i长度下无法被作为终点/当前是个单词节点,第一种情况是当前枚举的深度不够/这条链被单词末尾节点切断,导致字典树这条链当前没有办法到,第二种情况显然。
解释说明:(讲不清楚的口胡)
从初始状态开始枚举,枚举每一位的时候我们都相当于在做假设,下一位如果要修改为这个字母,那么目前最少修改多少字母,由于我们害怕当前状态会有病毒,所以一旦当前枚举的串的后缀是字典树某一个单词的前缀,我们就要走出根节点的“舒适圈”,在字典树中走,每一次枚举子节点,我们都会根据下一个节点的信息以及下一个节点失配链的信息,得出如果选择这个作为当前串的下一位,是否会出现完整病毒单词,以此来实现状态的转移。
也就是说,我们是在枚举每一位出现每个字母的情况,然后目前所有累积的情况根据后缀与字典树匹配,被分到字典树不同位置,判断 新添加下一位字母根据多了这一位后分到的位置 来进行转移。可想而知长度相同的串,会有很多点都到了一个点,我们取了这个长度下在那个点修改次数最少的。
代码:
#include<cstdio>
#include<cstring>
#include<iostream>
#include<queue>
#include<set>
#include<map>
#include<algorithm>
using namespace std;
#define ll long long
#define ull unsigned long long
#define for1(i,a,b) for (int i=a;i<=b;i++)
#define for0(i,a,b) for (int i=a;i<b;i++)
#define rof1(i,a,b) for (int i=a;i>=b;i--)
#define rof0(i,a,b) for (int i=a;i>b;i--)
#define pb push_back
#define fi first
#define se second
#define debug(x) printf("----Line %s----\n",#x)
#define pt(x,y) printf("%s = %d\n",#x,y)
#define INF 0x3f3f3f3f
#define dfl(x) ll x;scanf("%I64d",&x)
#define df2l(x,y) ll x,y;scanf("%I64d %I64d",&x,&y)
#define df(x) int x;scanf("%d",&x);
#define df2(x,y) int x,y;scanf("%d %d",&x,&y)
#define mod 1000000007
#define duozu(T) int T;scanf("%d",&T);while (T--)
const int maxnode = 50*20+5;//模式串数量*长度
const int ALP = 4;//字符种类数
char s[1005];
struct AC_am
{
queue<int>que;
int sz;
int trie[maxnode][ALP];
int fail[maxnode];
int last[maxnode];
int val[maxnode];//储存当前节点信息,如是否为单词节点等等
int newnode(int x){
memset(trie[x],0,sizeof trie[x]);
val[x] = 0;
return sz++;
}
void init(){
newnode(sz = 0);
}
int idx(char ch){//实际字符串转化为字典树对应节点,根据题目做出具体改变
if (ch=='A') return 0;
if (ch=='C') return 1;
if (ch=='G') return 2;
if (ch=='T') return 3;
}
void insert(char *s){
int u = 0;
for (int i=0;s[i];i++){
int c = idx(s[i]);
if (!trie[u][c]){
trie[u][c] = newnode(sz);
}
u = trie[u][c];
}
val[u]++;
}
void build(){
fail[0] = 0;
for (int c=0;c<ALP;c++){
int v = trie[0][c];
if (v){
que.push(v);
fail[v] = 0;
last[v] = 0;
}
}
while (!que.empty()){
int u = que.front();que.pop();
for (int c=0;c<ALP;c++){
int v = trie[u][c];
if (!v){
trie[u][c] = trie[fail[u]][c];
continue;
}
fail[v] = trie[fail[u]][c];
last[v] = val[fail[v]]? fail[v]:last[fail[v]];
que.push(v);
}
}
}
}ac;
int dp[1010][1010];///长度=i,终点为j的最少修改数
int main()
{
//freopen("C:/Users/DELL/Desktop/input.txt", "r", stdin);
//freopen("C:/Users/DELL/Desktop/output.txt", "w", stdout);
int n,ica = 1;
while (~scanf("%d",&n),n){
memset(dp,INF,sizeof dp);
ac.init();
for0(i,0,n) scanf("%s",s),ac.insert(s);
ac.build();
scanf("%s",s);
int L = strlen(s);
dp[0][0] = 0;
for0(l,0,L){
for0(u,0,ac.sz){
if (dp[l][u]==INF) continue;///当前没法沿着字典树走到这里
for0(c,0,4){
int v = ac.trie[u][c];
if (!ac.val[v] && !ac.last[v]){///子节点以及子节点的后缀链接都没有单词
if (c==ac.idx(s[l])) dp[l+1][v] = min(dp[l+1][v],dp[l][u]);
else dp[l+1][v] = min(dp[l+1][v],dp[l][u] + 1);
}
}
}
}
int ans = INF;
for0(u,0,ac.sz) ans = min(ans,dp[L][u]);
if (ans == INF) ans = -1;
printf("Case %d: %d\n",ica++,ans);
}
return 0;
}