【AC自动机】Keywords Search

【题目链接】

https://loj.ac/problem/10057

 

【题意】

原题来自:HDU 2222

给定  n 个长度不超过 50 的由小写英文字母组成的单词准备查询,以及一篇长为 m 的文章,问:文中出现了多少个待查询的单词。多组数据。

 

【题解】

模板题

 

【代码】

 1 #pragma GCC optimize(2)
 2 
 3 #include<queue>
 4 #include<cstdio>
 5 #include<cstring>
 6 #include<iostream>
 7 #include<algorithm>
 8 using namespace std;
 9 const int N = 5e5+1e4;
10 const int M = 1e6+10;
11 queue < int > Q ;
12 typedef struct Aho_Corasick_Automaton{
13     int Son[N][26],End[N],Fail[N],idx;
14     void Init(){
15         idx = 0 ;
16         while( !Q.empty() ) Q.pop() ;
17         memset(Son , 0 , sizeof Son );
18         memset(End , 0 , sizeof End );
19         memset(Fail, 0 , sizeof Fail );
20     }
21     void Insert(char s[]){
22         int p = 0 ;
23         for(int i=0;s[i];i++){
24             int t = s[i] - 'a';
25             if( !Son[p][t] )
26                 Son[p][t] = ++idx;
27             p = Son[p][t] ;
28         }
29         End[p] ++ ;
30     }
31 
32     void Build(){
33         for(int i=0;i<26;i++){
34             if( Son[0][i] )
35                 Fail[Son[0][i]] = 0 ,Q.push(Son[0][i]);
36         }
37 
38         while( !Q.empty() ){
39             int u = Q.front() ;
40             Q.pop();
41 
42             for(int i=0;i<26;i++){
43                 if( Son[u][i] ){
44                     Fail[Son[u][i]] = Son[Fail[u]][i] ;
45                     Q.push( Son[u][i] );
46                 }else{
47                     Son[u][i] = Son[Fail[u]][i];
48                 }
49             }
50         }
51     }
52 
53     void Query(char s[]){
54         int p = 0,res = 0;
55         for(int i=0;s[i];i++){
56             int t = s[i] - 'a';
57             p = Son[p][t] ;
58             for(int j=p ; j && ~End[j] ; j = Fail[j] ){
59                 res += End[j] ;
60                 End[j] = -1 ;
61             }
62         }
63         //printf("%d\n",res);
64         cout << res << endl ;
65     }
66 }AC_Machine ;
67 AC_Machine AC ;
68 char s[M];
69 int n;
70 int main(){
71 
72     ios_base :: sync_with_stdio(false);
73     cin.tie(NULL) , cout.tie(NULL);
74     int T;
75     cin >> T ;
76     while(T--){
77         cin >> n ;
78         AC.Init();
79         for(int i=0;i<n;i++){
80             //scanf("%s",s);
81             cin >> s ;
82             AC.Insert(s);
83         }
84         AC.Build();
85         //scanf("%s",s);
86         cin >> s ;
87         AC.Query(s);
88     }
89     return 0;
90 }
View Code

 

转载于:https://www.cnblogs.com/Osea/p/11366947.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python AC自动机是一个用于字符串匹配的算法,它可以高效地在一段文本中查找多个预定义的模式。它的实现可以使用多种库,其中包括ac自动机python和ahocorasick-pythonac自动机python是一个对标准的ac自动机算法进行了完善和优化的实现,适用于主流的Python发行版,包括Python2和Python3。它提供了更准确的结果,并且可以通过pip进行安装,具体的安装方法可以参考官方文档或者使用pip install命令进行安装。 ahocorasick-python是另一个实现AC自动机的库,它也可以用于Python2和Python3。你可以通过官方网站或者GitHub源码获取更多关于该库的信息和安装指南。 对于AC自动机的使用,一个常见的例子是在一段包含m个字符的文章中查找n个单词出现的次数。要了解AC自动机,需要有关于模式树(字典树)Trie和KMP模式匹配算法的基础知识。AC自动机的算法包括三个步骤:构造一棵Trie树,构造失败指针和模式匹配过程。在构造好AC自动机后,可以使用它来快速地在文本中查找预定义的模式,并统计它们的出现次数。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [ahocorasick-python:AC自动机python的实现,并进行了优化。 主要修复了 查询不准确的问题](https://download.csdn.net/download/weixin_42122986/18825869)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* *3* [Python实现多模匹配——AC自动机](https://blog.csdn.net/zichen_ziqi/article/details/104246446)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值