题面
F J FJ FJ把杂志上所有的文章摘抄了下来并把它变成了一个长度不超过 1 0 5 10^5 105的字符串 S S S。他有一个包含n个单词的列表,列表里的n个单词记为 t 1 . . . t N t_1...t_N t1...tN。他希望从 S S S中删除这些单词。
F J FJ FJ每次在 S S S中找到最早出现的列表中的单词(最早出现指该单词的开始位置最小),然后从 S S S中删除这个单词。他重复这个操作直到 S S S中没有列表里的单词为止。注意删除一个单词后可能会导致 S S S中出现另一个列表中的单词
F J FJ FJ注意到列表中的单词不会出现一个单词是另一个单词子串的情况,这意味着每个列表中的单词在 S S S中出现的开始位置是互不相同的.
请帮助 F J FJ FJ完成这些操作并输出最后的S
算法分析
多模式串匹配,使用AC自动机。
方法类似银组题目 [USACO2015FEB」Censoring (Sliver银组)
使用两个栈记录每个主串的字符对应的Trie树上的节点,删除一个字符串后,从删除前一个字符继续匹配。
参考程序
#include<bits/stdc++.h>
using namespace std;
const int N=100010;
int trie[N][26],tot=1,vis[N],nxt[N],deep[N];
int n;
char S[N],T[N];
char st[N];
int top;
int num[N];
queue<int> q;
void built()
{
int len=strlen(T);
int u=1; //根节点
deep[1]=0;
for(int i=0;i<len;i++)
{
int v=T[i]-'a';
if(trie[u][v]==0) {trie[u][v]=++tot;deep[tot]=deep[u]+1;}//根节点为1,tot初始化一定设为1
u=trie[u][v];
}
vis[u]=1; //结束标记
}
void bfs()
{
//初始化,根节点的孩子结点nxt指向根节点
for(int i=0;i<=25;i++)
{
int v=trie[1][i];
if(v) nxt[v]=1,q.push(v);
else trie[1][i]=1; //优化,不存在直接又从1开始
}
while(!q.empty())
{
int u=q.front();
q.pop();
for(int i=0;i<=25;i++)
{
int v=trie[u][i];
if(v==0) trie[u][i]=trie[nxt[u]][i]; //优化,如果不存在则指向nxt[u]相同字符转移边,就不用再递归去找nxt[u]
else
{
q.push(v);
nxt[v]=trie[nxt[u]][i]; //存在,u的转移边结点v等于nxt[u]相同转移边的结点
}
}
}
}
void find()
{
int u=1,ans=0;
int len=strlen(S);
for(int i=0;i<len;i++)
{
int v=S[i]-'a';
u=trie[u][v]; //优化后不需要判断是否存在结点u的转移边
st[++top]=S[i];
num[top]=u;
if(vis[u]==1) //匹配成功,弹出匹配字符串长度(深度)
{
top-=deep[u];
if(top==0) u=1; //栈为空
else u=num[top];
}
}
for(int i=1;i<=top;i++)
printf("%c",st[i]);
cout<<endl;
}
int main()
{
scanf("%s",S);
scanf("%d\n",&n);
for(int i=1;i<=n;i++)
{
scanf("%s",T);
built();
}
bfs();
find();
return 0;
}