http://acm.hdu.edu.cn/showproblem.php?pid=3065
题目大意:先给出一些单词,然后给出一段文章,统计并输出每个单词在文章中出现的次数。
#include"iostream"
#include"cstdio"
#include"cstring"
#include"queue"
using namespace std;
char word[1005][55],article[2000005];
int cnt[1005];
//结点结构
struct node
{
int num;//标记第num个单词的结尾
node* next[26];
node* fail;
node(){ //构造函数,初始化结点
num=-1;
fail=NULL;
memset(next,NULL,sizeof(next));
}
};
//插入单词
void insert(int num,char* str,node* root)
{
int i,n=strlen(str);
node* p=root;
for(i=0;i<n;i++){
int k=str[i]-'A';
if(p->next[k]==NULL){
p->next[k]=new node();
}
p=p->next[k];
}
p->num=num;//标记出第num个单词的结尾
}
//确定fail指针
void makeFail(node* root)
{
queue<node*>q;
q.push(root);
while(!q.empty()){
node* front=q.front();
q.pop();
for(int i=0;i<26;i++){
if(front->next[i]!=NULL){
node *temp=front->fail;
while(temp!=NULL){
if(temp->next[i]!=NULL){
front->next[i]->fail=temp->next[i];
break;
}
temp=temp->fail;
}
if(temp==NULL)
front->next[i]->fail=root;
q.push(front->next[i]);
}
}
}
}
//搜索单词
void search(char* str,node* root)
{
int i,n=strlen(str);
node* p=root;
for(i=0;i<n;i++){
if(str[i]<'A'||str[i]>'Z'){//如果出现其他字符,从root开始重新标记
p=root;
continue;
}
int k=str[i]-'A';
while(p!=root&&p->next[k]==NULL)
p=p->fail;
if(p->next[k]!=NULL){
p=p->next[k];
node* temp=p;
while(temp!=root){
if(temp->num!=-1) //当该处是第num个单词的结尾时
cnt[temp->num]++;
temp=temp->fail;
}
}
}
}
//释放内存
void freedom(node* p)
{
for(int i=0;i<26;i++){
if(p->next[i]!=NULL)
freedom(p->next[i]);
}
delete p;
}
//主函数
int main()
{
int T,i;
while(scanf("%d",&T)!=EOF){
memset(cnt,0,sizeof(cnt));
node* root=new node();
getchar();
for(i=0;i<T;i++){
gets(word[i]);
insert(i,word[i],root);
}
makeFail(root);
gets(article);
search(article,root);
for(i=0;i<T;i++){
if(cnt[i]>0)
printf("%s: %d\n",word[i],cnt[i]);
}
freedom(root);
}
return 0;
}