Zoj 3228 Searching the String (字符串_AC自动机)

题目链接:http://acm.zju.edu.cn/onlinejudge/showProblem.do?problemCode=3228


题目大意给定一篇长为n的文章,m个需要查找在文章中出现的次数的单词,每个单词佩带一个0或1,0表示从文章中查找时单词可以重叠,1表示不可以重叠。


解题思路:这题不难,关键是要找到两个查找操作的性质以及理解ac自动机的查找机制。可以重叠的时候就是常规的在ac自动机上查找,当正确匹配一个字符时,回溯查找这个节点的后缀节点,如果这些节点都是某个字符串的结尾,那么出现次数加1。当不可以重叠的时候还必须考虑出现次数最大,其实就是贪心,每次选最先出现的会使答案最优,然后不重叠前面一个匹配的位置和后一个匹配的位置至少要大于这个单词的长度才不会重叠,那每次查询的时候更新各节点前一次出现的位置即可,我的代码中用time表示。

    这题Mle了一次,因为数组开到了11万*10,并且有多个。然后为了节省内存,把存储单词的dir开成11万*6,,题目说长度小等于6的,那应该没问题的啊,可是我就Wa了,改成11万*7就AC了,无语...


测试数据:

abababac
4
0 ab
0 aba
1 ab
1 aba


abababac
2
0 aba
1 aba


aaaaacaa
6
0 a
0 aa
0 aaa
1 a
1 aa
1 aaa


代码:

#include <stdio.h>
#include <string.h>
#define MIN 26
#define MAX 101000


struct node {

	int flag,cnt[2];
	int len,time;
	node *fail,*next[26];
}*qu[MAX*6],arr[MAX*6],*root;

int  n,m,total;
bool flag[MAX];
char dir[MAX][10],str[MAX];


node *CreateNode(){

	node *p = &arr[total++];
	p->flag = p->time = 0;
	p->cnt[0] = p->cnt[1] = 0;
	p->fail = NULL;
	for (int i = 0; i < MIN; ++i)
		p->next[i] = NULL;
	return p;
}
void Insert(char *dir,int in){

	int i = 0,k;
	node *p = root;
	

	while (dir[i]) {

		k = dir[i++] - 'a';
		if (p->next[k] == NULL)
			p->next[k] = CreateNode();
		p = p->next[k];
	}
	p->flag = 1,p->len = i;
}
void Build_AC() {

	int head = 0,tail = 0;
	root->fail = root;
	qu[++head] = root;


	while (tail < head) {

		node *p = qu[++tail];
		for (int k = 0; k < MIN; ++k) 
			if (p->next[k] != NULL) {

				if (p == root) p->next[k]->fail = root;
				else p->next[k]->fail = p->fail->next[k];
				qu[++head] = p->next[k];
			}
			else {
				
				if (p == root) p->next[k] = root;
				else p->next[k] = p->fail->next[k];
			}
	}
}	
void Query_AC(char *str) {

	int i = 0,k,t = 0;
	node *p = root;


	while (str[i]) {

		k = str[i++] - 'a';
		t++,p = p->next[k];


		node *temp = p;
		while (temp != root) {
			
			if (temp->flag) {

				if (t - temp->time >= temp->len)
					temp->cnt[1]++,temp->time = t;
				temp->cnt[0]++;
			}
			temp = temp->fail;
		}
	}
}
int Search_1A(char *dir,bool flag){

	int i = 0,k;
	node *p = root;


	while (dir[i]) {

		k = dir[i++] - 'a';
		p = p->next[k];
	}
	k = flag ? 1 : 0;
	return p->cnt[k];
}


int main()
{
	int i,j,k,ans,cas = 0;


	while (scanf("%s",str) != EOF) {

		total = 0;
		root = CreateNode();
		scanf("%d",&n);
		for (i = 0; i < n; ++i) {

			scanf("%d%s",&k,dir[i]);
			flag[i] = k ? true : false;
			Insert(dir[i],i);
		}

		
		Build_AC();
		Query_AC(str);
		printf("Case %d\n",++cas);
		for (i = 0; i < n; ++i) {

			ans = Search_1A(dir[i],flag[i]);
			printf("%d\n",ans);
		}
		printf("\n");
	}
}

本文ZeroClock原创,但可以转载,因为我们是兄弟。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值