题意:
给出n篇文章,m个单词,输出每篇文章中单词出现的次数,其中单词会重复。
思路:
AC自动机模板题,添加一个单词的结尾标记记录即可。这里我们用了kuangbin的模板。
代码:
#include <iostream>
#include <stdio.h>
#include <string.h>
#include <algorithm>
#include <queue>
#include<map>
using namespace std;
string str;
string buf[100005];
struct Trie
{
int next[10010*50][128],fail[100010*50],end[101000*50];
int root,L;
int newnode()
{
for(int i = 0;i < 128;i++)
next[L][i] = -1;
end[L++] = -1;
return L-1;
}
void init()
{
L = 0;
root = newnode();
}
void insert(string s ,int id)
{
int len = s.length();
int now = root;
for(int i = 0;i < len;i++)
{
if(next[now][s[i]] == -1)
next[now][s[i]] = newnode();
now = next[now][s[i]];
}
if(end[now]==-1)//就是这里,记录单词的次数
end[now]=1;
else
end[now]++;
}
void build()
{
queue<int>Q;
fail[root] = root;
for(int i = 0;i < 128;i++)
if(next[root][i] == -1)
next[root][i] = root;
else
{
fail[next[root][i]] = root;
Q.push(next[root][i]);
}
while(!Q.empty())
{
int now = Q.front();
Q.pop();
for(int i = 0;i < 128;i++)
if(next[now][i] == -1)
next[now][i]=next[fail[now]][i];
else
{
fail[next[now][i]]=next[fail[now]][i];
Q.push(next[now][i]);
}
}
}
int num[100005];
void query(string buf,int n)
{
for(int i = 0;i < n;i++)
num[i] = 0;
int len=buf.length();
int now=root;
for(int i=0;i<len;i++)
{
now=next[now][buf[i]];
int temp = now;
while( temp != root )
{
if(end[temp] != -1)//统计单词次数
num[end[temp]]+=end[temp];
temp = fail[temp];
}
}
int ans=0;
for(int i = 0;i < n;i++)
if(num[i] > 0)
{
ans+=num[i];
}
cout<<ans<<endl;
}
};
Trie ac;
int main()
{
int t;
cin>>t;
while(t--)
{
int n,m;
cin>>n>>m;
ac.init();
for(int i=1;i<=n;i++)
cin>>buf[i];
for(int i = 0;i < m;i++)
{
cin>>str;
ac.insert(str,i);
}
ac.build();
for(int i=1;i<=n;i++)
ac.query(buf[i],m);
}
return 0;
}