题目:
http://acm.hdu.edu.cn/showproblem.php?pid=2222
题意:
给若干模式串,以及一个主串,问在主串中出现了多少个模式串
思路:
AC自动机模板题,我是拿这题来学AC自动机的,按白书的模板敲再做一些简单修改即可
本题有两个陷阱,一是模式串可能重复出现,二是同一个主串中的同一个模式串可能出现多次,只能按一次算。解决这两个问题我的方法是建trie树时把 val[u] = v 换成val[u] += v; 则val[u]为该模式串出现的次数,每次找到匹配的时候ans += val[u]; val[u] = 0;就可以保证重复出现可以多次计入总数,又不会因为在主串中的多次出现而多次计算
代码:
#include <stdio.h>
#include <iostream>
#include <string.h>
#include <queue>
using namespace std;
const int MAXSIZE = 1e6 + 50;
const int MAXNODE = 1e6 +50;
int ans;
int tree[MAXNODE][27]; //第一维大小取决于字符总数,第二维取决于字符种类个数
int val[MAXNODE]; //val为0代表中间结点
int sz;
int f[MAXNODE];
int last[MAXNODE];
int idx(char c){
return c - 'a';
}
void init(){
sz = 1;
memset(tree[0], 0, sizeof(tree[0]));
ans = 0;
}
void tinsert(char s[], int v){
int u = 0, len = strlen(s);
for (int i = 0; i<len; ++i){
int c = idx(s[i]);
if (!tree[u][c]){
memset(tree[sz], 0, sizeof(tree[sz]));
val[sz] = 0;
tree[u][c] = sz++;
}
u = tree[u][c];
}
val[u] += v;
}
void getFail(){
queue<int> q;
f[0] = 0;
for (int i=0;i<26;++i){
int u = tree[0][i];
if (u) {
f[u] = 0;
q.push(u);
last[u] = 0;
}
}
while (!q.empty()){
int r = q.front();
q.pop();
for (int i = 0;i<26;++i){
int u = tree[r][i];
if (!u) continue;
q.push(u);
int v = f[r];
while (v && !tree[v][i]) v = f[v];
f[u] = tree[v][i];
last[u] = val[f[u]] ? f[u] : last[f[u]];
}
}
}
void doit(int j){
if (j){
//printf("%d: %d\n",j,val[j]);
ans+=val[j];
val[j] = 0;
doit(last[j]);
}
}
void acfind(char t[]){
int n = strlen(t);
int j = 0;
for (int i=0;i<n;++i){
int c = idx(t[i]);
while (j && !tree[j][c]) j = f[j];
j = tree[j][c];
if (val[j]) doit(j);
else if (last[j]) doit(last[j]);
}
}
char temp[55];
char str[MAXSIZE];
int main(){
int total;
cin>>total;
while (total--){
int m;
init();
scanf("%d",&m);
for (int i=1;i<=m;++i){
scanf("%s",temp);
tinsert(temp,1);
}
scanf("%s",str);
getFail();
acfind(str);
cout<<ans<<endl;
}
}