Keywords Search(AC自动机)

 题目:Keywords Search——http://acm.hdu.edu.cn/showproblem.php?pid=2222

题意:给 n 个模式串,一个文本串,询问能匹配的模式串的个数。

思路:ac自动机板子,注意文本串中有重复。

代码:

#include <iostream>
#include <cstdio>
#include <queue>
#include <cstring>
#include <algorithm>
#define LL long long
using namespace std;
const int maxn = 1e6+5;
const int siz = 26;

char s[maxn];
int t, n, dp[maxn], ans[maxn];

int head[maxn], cnt_edge;
struct Edge{
    int to, nxt;
}edge[maxn];
void addedge(int from, int to){
    edge[++cnt_edge].to = to;
    edge[cnt_edge].nxt = head[from];
    head[from] = cnt_edge;
}
//------------------------------------------------------//
struct AC_auto{
    int tr[maxn][siz], cnt;
    int fail[maxn];
    int ed[maxn];

    void Insert(char *s){   //插入单词
        int p = 0, len = strlen(s);
        for(int i=0; i<len; i++){
            int v = s[i]-'a';
            if(!tr[p][v]) tr[p][v] = ++cnt;
            p = tr[p][v];
        }
        ed[p] ++;
    }
    void build_fail(){  //建立fail指针
        queue<int>q;
        for(int i=0; i<siz; i++) if(tr[0][i]) q.push(tr[0][i]), addedge(0, tr[0][i]);
        while(q.size()){
            int p = q.front(); q.pop();
            for(int i=0; i<siz; i++){
                if(tr[p][i]) {
                    fail[tr[p][i]] = tr[fail[p]][i];
                    q.push(tr[p][i]);
                    addedge(tr[fail[p]][i], tr[p][i]);
                }else tr[p][i] = tr[fail[p]][i];
            }
        }
    }
    void ask(char *s){  //统计 s 经过的树的路径
        int len = strlen(s), p = 0, ans = 0;
        for(int i=0; i<len; i++){
            p = tr[p][s[i]-'a'];
            dp[p] ++;
        }
    }
    void dfs(int x){    //更新dp[]
        for(int i=head[x]; i!=-1; i=edge[i].nxt){
            int y = edge[i].to;
            dfs(y);
            dp[x] += dp[y];
        }
        if(dp[x]) ans[x] = ed[x];
    }
    void clr(){ //初始化
        memset(fail, 0, sizeof(fail));
        memset(tr, 0, sizeof(tr));
        memset(ed, 0, sizeof(ed));
        cnt = 0;
    }
    void print(){   //debug
        cout << "ed: "; for(int i=1; i<=cnt; i++) cout << ed[i] << " "; cout << endl;
        cout << "fail: "; for(int i=1; i<=cnt; i++) cout << fail[i] << " "; cout << endl;
        for(int i=0; i<cnt; i++){
            for(int j=0; j<siz; j++){
                if(tr[i][j])
                printf("%d---%c----%d\n", i, (char)j+'a', tr[i][j]);
            }
        }
    }
}AC;
//---------------------------------------------------------//
void init(){
    AC.clr();
    memset(ans, 0, sizeof(ans));
    memset(dp, 0, sizeof(dp));
    memset(head, -1, sizeof(head));
    cnt_edge = 0;
}
int main()
{
    scanf("%d", &t);
    while(t--){
        init();
        scanf("%d", &n);
        for(int i=1; i<=n; i++){
            scanf("%s", s);
            AC.Insert(s);
        }
        AC.build_fail();
        scanf("%s", s);
        
        AC.ask(s);
        AC.dfs(0);
        for(int i=1; i<=AC.cnt; i++) ans[0] += ans[i];
        cout << ans[0] << endl;
    }
}
/** output:5 3 4 6
5
aba
bab
ab
ba
ababa
abababababababab
3
she
she
she
shesheshe
6
she
he
he
say
shr
her
yasherhs
6
a
ba
cba
dcba
baf
f
dcbafd
*/

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python AC动机是一个用于字符串匹配的算法,它可以高效地在一段文本中查找多个预定义的模式。它的实现可以使用多种库,其中包括ac动机python和ahocorasick-python。 ac动机python是一个对标准的ac动机算法进行了完善和优化的实现,适用于主流的Python发行版,包括Python2和Python3。它提供了更准确的结果,并且可以通过pip进行安装,具体的安装方法可以参考官方文档或者使用pip install命令进行安装。 ahocorasick-python是另一个实现AC动机的库,它也可以用于Python2和Python3。你可以通过官方网站或者GitHub源码获取更多关于该库的信息和安装指南。 对于AC动机的使用,一个常见的例子是在一段包含m个字符的文章中查找n个单词出现的次数。要了解AC动机,需要有关于模式树(字典树)Trie和KMP模式匹配算法的基础知识。AC动机的算法包括三个步骤:构造一棵Trie树,构造失败指针和模式匹配过程。在构造好AC动机后,可以使用它来快速地在文本中查找预定义的模式,并统计它们的出现次数。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [ahocorasick-python:AC动机python的实现,并进行了优化。 主要修复了 查询不准确的问题](https://download.csdn.net/download/weixin_42122986/18825869)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* *3* [Python实现多模匹配——AC动机](https://blog.csdn.net/zichen_ziqi/article/details/104246446)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值