【AC自动机】Censoring

【题目链接】

https://loj.ac/problem/10059

 

【题意】

有一个长度不超过  1e5 的字符串 。Farmer John 希望在 T 中删掉 n 个屏蔽词(一个屏蔽词可能出现多次),这些词记为 P1,P2……Pn

 

【题解】

利用栈来进行匹配删除即可。

1、建模式串的AC自动机。(结尾位置记录长度)

2、利用文本串跑一遍AC自动机。

3、在跑的过程中,如果遇到屏蔽字的结尾时,相应操作为:1、把栈里弹出模式串的长度,2、同时文本串继续跑。

4、跑的过程中还需要一个辅助的数组记录当前是 匹配到文本串的在AC自动机上的下标。

 

 1 #include<cstdio>
 2 #include<cstring>
 3 #include<algorithm>
 4 using namespace std;
 5 const int N = 1e5+100;
 6 char S[N],T[N];
 7 int Trie[N][26],fail[N],End[N];
 8 int n,Ans[N],Back_up[N],top,idx=1;
 9 int Q[N],Head,Tail;
10 void Insert( char s[] , int Id ){
11     int len = 0 , p = 1 ;
12 
13     for(int i=0;s[i];i++,len++){
14         int t = s[i] - 'a' ;
15         if( !Trie[p][t] )
16             Trie[p][t] = ++idx ;
17         p = Trie[p][t] ;
18     }
19     End[p] = len ;
20 }
21 void Build(){
22     Head = 1 , Tail = 0 ;
23     for(int i=0;i<26;i++) Trie[0][i] = 1;
24 
25     Q[ ++Tail ] = 1 ;
26 
27     while( Head <= Tail ){
28         int u = Q[Head++] ;
29         for(int i=0;i<26;i++){
30             int To = Trie[u][i];
31             if(To){
32                 fail[To] = Trie[fail[u]][i];
33                 Q[++Tail] = To ;
34             }else{
35                 Trie[u][i] = Trie[fail[u]][i];
36             }
37         }
38     }
39 }
40 
41 int main()
42 {
43     scanf("%s",T);
44     scanf("%d",&n);
45     for(int i=1;i<=n;i++){
46         scanf("%s",S);
47         Insert( S , i );
48     }
49     Build();
50 
51     for(int i=0,p=1;T[i];i++){
52         Back_up[i] = p = Trie[p][T[i]-'a'];
53         Ans[++top] = i;
54 
55         if( End[p] ){
56             top = top - End[p];
57             p = Back_up[Ans[top]];
58         }
59     }
60     for(int i=1;i<=top;i++){
61         putchar(T[Ans[i]]);
62     }
63     putchar('\n');
64     return 0;
65 }
Censoring

 

转载于:https://www.cnblogs.com/Osea/p/11366987.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python AC自动机是一个用于字符串匹配的算法,它可以高效地在一段文本中查找多个预定义的模式。它的实现可以使用多种库,其中包括ac自动机python和ahocorasick-python。 ac自动机python是一个对标准的ac自动机算法进行了完善和优化的实现,适用于主流的Python发行版,包括Python2和Python3。它提供了更准确的结果,并且可以通过pip进行安装,具体的安装方法可以参考官方文档或者使用pip install命令进行安装。 ahocorasick-python是另一个实现AC自动机的库,它也可以用于Python2和Python3。你可以通过官方网站或者GitHub源码获取更多关于该库的信息和安装指南。 对于AC自动机的使用,一个常见的例子是在一段包含m个字符的文章中查找n个单词出现的次数。要了解AC自动机,需要有关于模式树(字典树)Trie和KMP模式匹配算法的基础知识。AC自动机的算法包括三个步骤:构造一棵Trie树,构造失败指针和模式匹配过程。在构造好AC自动机后,可以使用它来快速地在文本中查找预定义的模式,并统计它们的出现次数。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [ahocorasick-python:AC自动机python的实现,并进行了优化。 主要修复了 查询不准确的问题](https://download.csdn.net/download/weixin_42122986/18825869)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* *3* [Python实现多模匹配——AC自动机](https://blog.csdn.net/zichen_ziqi/article/details/104246446)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值