题目链接:http://acm.zju.edu.cn/onlinejudge/showProblem.do?problemCode=3228
题目大意:给定一篇长为n的文章,m个需要查找在文章中出现的次数的单词,每个单词佩带一个0或1,0表示从文章中查找时单词可以重叠,1表示不可以重叠。
解题思路:这题不难,关键是要找到两个查找操作的性质以及理解ac自动机的查找机制。可以重叠的时候就是常规的在ac自动机上查找,当正确匹配一个字符时,回溯查找这个节点的后缀节点,如果这些节点都是某个字符串的结尾,那么出现次数加1。当不可以重叠的时候还必须考虑出现次数最大,其实就是贪心,每次选最先出现的会使答案最优,然后不重叠前面一个匹配的位置和后一个匹配的位置至少要大于这个单词的长度才不会重叠,那每次查询的时候更新各节点前一次出现的位置即可,我的代码中用time表示。
这题Mle了一次,因为数组开到了11万*10,并且有多个。然后为了节省内存,把存储单词的dir开成11万*6,,题目说长度小等于6的,那应该没问题的啊,可是我就Wa了,改成11万*7就AC了,无语...
测试数据:
abababac
4
0 ab
0 aba
1 ab
1 aba
abababac
2
0 aba
1 aba
aaaaacaa
6
0 a
0 aa
0 aaa
1 a
1 aa
1 aaa
代码:
#include <stdio.h>
#include <string.h>
#define MIN 26
#define MAX 101000
struct node {
int flag,cnt[2];
int len,time;
node *fail,*next[26];
}*qu[MAX*6],arr[MAX*6],*root;
int n,m,total;
bool flag[MAX];
char dir[MAX][10],str[MAX];
node *CreateNode(){
node *p = &arr[total++];
p->flag = p->time = 0;
p->cnt[0] = p->cnt[1] = 0;
p->fail = NULL;
for (int i = 0; i < MIN; ++i)
p->next[i] = NULL;
return p;
}
void Insert(char *dir,int in){
int i = 0,k;
node *p = root;
while (dir[i]) {
k = dir[i++] - 'a';
if (p->next[k] == NULL)
p->next[k] = CreateNode();
p = p->next[k];
}
p->flag = 1,p->len = i;
}
void Build_AC() {
int head = 0,tail = 0;
root->fail = root;
qu[++head] = root;
while (tail < head) {
node *p = qu[++tail];
for (int k = 0; k < MIN; ++k)
if (p->next[k] != NULL) {
if (p == root) p->next[k]->fail = root;
else p->next[k]->fail = p->fail->next[k];
qu[++head] = p->next[k];
}
else {
if (p == root) p->next[k] = root;
else p->next[k] = p->fail->next[k];
}
}
}
void Query_AC(char *str) {
int i = 0,k,t = 0;
node *p = root;
while (str[i]) {
k = str[i++] - 'a';
t++,p = p->next[k];
node *temp = p;
while (temp != root) {
if (temp->flag) {
if (t - temp->time >= temp->len)
temp->cnt[1]++,temp->time = t;
temp->cnt[0]++;
}
temp = temp->fail;
}
}
}
int Search_1A(char *dir,bool flag){
int i = 0,k;
node *p = root;
while (dir[i]) {
k = dir[i++] - 'a';
p = p->next[k];
}
k = flag ? 1 : 0;
return p->cnt[k];
}
int main()
{
int i,j,k,ans,cas = 0;
while (scanf("%s",str) != EOF) {
total = 0;
root = CreateNode();
scanf("%d",&n);
for (i = 0; i < n; ++i) {
scanf("%d%s",&k,dir[i]);
flag[i] = k ? true : false;
Insert(dir[i],i);
}
Build_AC();
Query_AC(str);
printf("Case %d\n",++cas);
for (i = 0; i < n; ++i) {
ans = Search_1A(dir[i],flag[i]);
printf("%d\n",ans);
}
printf("\n");
}
}
本文ZeroClock原创,但可以转载,因为我们是兄弟。