题意:
给你N (1 ≤ N ≤ 50)个只由“A”,“G”,“C”,“T”四个字母组成的病毒串(len<=20)
给你一个文本串(len<=1000),求最少改变文本串中的多少个字符(也只能改成“A”,“G”,“C”,“T”)能够使得文本串中没有一个病毒串存在?
做法:
ac自动机+dp。
将病毒串建立ac自动机,题目要求的即是文本串不能经过任何ac自动机上的单词节点。
f[i][j]表示第i个节点,当前在文本串第j位,最少改变多少个字符。
枚举下一位是什么字母转移。
可以用记搜实现。
易错点:
代码中用了一个id[x]表示字符x的编号。但是id的下标范围一开始开错了,开成了5!!事实上应该开大,因为是字符ASIIC码的下标。
代码:
/*************************************************************
Problem: poj 3691 DNA repair
User: bestFy
Language: C++
Result: Accepted
Time: 79 MS
Memory: 4696K
Submit_Time: 2018-01-13 14:52:05
*************************************************************/
#include<cstdio>
#include<cstring>
#include<iostream>
#include<algorithm>
#include<cmath>
#include<cstdlib>
#include<cctype>
#include<queue>
using namespace std;
const int N = 1010;
int n, tot, len;
int c[N][5], w[N], id[100]/*这里不要开成5!!*/, fail[N], f[N][N];
char s[N];
inline void insert(char s[])
{
int len = strlen(s), o = 0;
for(int i = 0; i < len; i ++) {
if(!c[o][id[s[i]]]) c[o][id[s[i]]] = ++ tot;
o = c[o][id[s[i]]];
}
w[o] = 1;
}
inline void build()
{
queue<int> q;
for(int i = 0; i < 4; i ++) if(c[0][i]) { q.push(c[0][i]); fail[c[0][i]] = 0; }
while(!q.empty()) {
int u = q.front(); q.pop();
for(int i = 0; i < 4; i ++) if(c[u][i]) {
fail[c[u][i]] = c[fail[u]][i];
if(w[fail[c[u][i]]]) w[c[u][i]] = 1;
q.push(c[u][i]);
} else c[u][i] = c[fail[u]][i];
}
}
inline void query(int u, int l)
{
if(l == len) { f[u][l] = 0; return; }
if(f[u][l] != -1) return;
int ret = 1e9;
for(int i = 0; i < 4; i ++)
if(!w[c[u][i]]) {
query(c[u][i], l+1);
ret = min(ret, f[c[u][i]][l+1]+(id[s[l]]!=i));
}
f[u][l] = ret;
}
int main()
{
id['A'] = 0; id['G'] = 1; id['C'] = 2; id['T'] = 3;
int cas = 0;
while(~scanf("%d", &n) && n) {
tot = 0;
memset(w, 0, sizeof w); memset(fail, 0, sizeof fail); memset(c, 0, sizeof c);
for(int i = 1; i <= n; i ++) {
scanf("%s", s);
insert(s);
}
build();
scanf("%s", s); len = strlen(s);
memset(f, -1, sizeof f);
query(0, 0);
printf("Case %d: ", ++ cas);
if(f[0][0] == 1e9) puts("-1"); else printf("%d\n", f[0][0]);
}
return 0;
}