AC自动机 洛谷P3796

题目链接:https://www.luogu.org/problem/P3796

题意:给多个模式串和一个文本串,要求出模式串匹配最多的次数是多少,并输出这些次数的模式串。

分析:求匹配次数很明显,把AC_qurey函数稍微改一下就好,但要输出这些模式串我就迷了,当时认为Trie只能上到下,到了一个结点无法回到其上的结点,就不会了,事实上还是很浅显,另外用一个数组记录位置就好了啊。。。。将字典树结点中的end改为只有其是一个单词的结尾才做标记,并且标记这个单词的次序。

clean函数应该就是AC自动机里的初始化了,因为不知道会用到多少边,故是每当cnt增加了(即出现了新的一条边)的时候我们再初始化

#include<bits/stdc++.h>
using namespace std;
const int maxn=1e6+10;
const int inf=0x3f3f3f3f;
typedef long long ll;
#define meminf(a) memset(a,0x3f,sizeof(a))
#define mem0(a) memset(a,0,sizeof(a));
struct result{
    int num,pos;
}ans[200];
bool cmp(const result &a,const result &b){
    if(a.num==b.num) return a.pos<b.pos;
    return a.num>b.num;
}
struct node{
    int fail;//失配指针fail
    int vis[26];//子节点的位置,也就是字典树的那26个字母
    int end;//如果是尾节点就记录 
}AC[maxn];
char s[200][100];//用来输入模式串
char ss[maxn]; //用来输入文本串 
int cnt=0;//Trie的指针 
void clean(int x){
    mem0(AC[x].vis);
    AC[x].end=0;
    AC[x].fail=0;
}
void insert(char *s,int pos){
    int len=strlen(s);
    int now=0;//字典树的当前指针
    for(int i=0;i<len;i++){
        //Trie树没有这个子节点 
        if(AC[now].vis[s[i]-'a']==0) AC[now].vis[s[i]-'a']=++cnt,clean(cnt);
        //多组输入,需要清除 一个个清除,之前++cnt说明需要用到这个节点了 
        now=AC[now].vis[s[i]-'a'];
    }
    AC[now].end=pos;//标记该结点是一个单词的结尾 ,并标记这是第几个单词 
}

void get_fail(){
    queue<int> que;
    for(int i=0;i<26;i++){//把第二层的fail指针都设为0 
        if(AC[0].vis[i]!=0)
        {
            AC[AC[0].vis[i]].fail=0;
            que.push(AC[0].vis[i]);
        }            
    }
    while(!que.empty())
    {
        int u=que.front();que.pop();
        for(int i=0;i<26;i++){
            if(AC[u].vis[i]!=0){
                //如果当前结点的子节点存在,就将子节点的fail指针指向当前结点fail指针指向的结点的对应子节点处 
                AC[AC[u].vis[i]].fail=AC[AC[u].fail].vis[i];
                que.push(AC[u].vis[i]);
            }
            else AC[u].vis[i]=AC[AC[u].fail].vis[i];
            //否则直接将这个不存在的子节点指向当前结点fail指针指向结点的对应子节点处 
        }
    }
}

void AC_query(char* s){
    int len=strlen(s);
    int now=0;
    for(int i=0;i<len;i++){
        now=AC[now].vis[s[i]-'a'];
        for(int t=now;t!=0;t=AC[t].fail){
            ans[AC[t].end].num++;
        }
    }
}

int main(){
    int n;
    while(~scanf("%d",&n))
    {
    if(n==0) break;
    cnt=0;
    clean(0);//每次到一个新的边时,都记得清空之前的数据 
    for(int i=1;i<=n;i++){
        ans[i].num=0;
        ans[i].pos=i;
        scanf("%s",s[i]);
        insert(s[i],i);
    }
    AC[0].fail=0;//结束标志     
    get_fail(); //求出失配指针 
    scanf("%s",ss);
    AC_query(ss); 
    sort(ans+1,ans+1+n,cmp);
    printf("%d\n",ans[1].num);
    for(int i=1;i<=n;i++){
        if(ans[i].num==ans[1].num){
            printf("%s\n",s[ans[i].pos]);
        }
        else break;
    }
    }
    return 0;
} 

 

转载于:https://www.cnblogs.com/qingjiuling/p/11375228.html

### 关于洛谷 P3167 使用 AC 自动机的解题思路 对于洛谷 P3167 的求解,可以采用 AC 自动机来处理多模式字符串匹配问题。此算法不仅能够高效地构建 Trie 树结构用于存储所有模式串,还通过建立失败指针(fail)使得能够在遇到不匹配情况时快速跳转到可能继续匹配的位置。 #### 构建Trie树并插入单词 为了实现这一目标,在初始化阶段需先遍历每一个给定的关键字,并将其逐字符加入至已有的前缀树(Trie Tree)当中形成节点连接关系[^1]。当某个新字母未能找到对应的子节点时,则创建新的分支;而一旦完成整个关键字路径铺设之后便标记终点表示存在以此序列结尾的有效词条。 ```cpp void insert(const string &s){ int p = root; for(auto c : s){ int u = c - 'a'; if(!tr[p][u]) tr[p][u] = ++idx; p = tr[p][u]; } cnt[p]++; } ``` #### 建立fail指针 接下来要做的就是利用队列广度优先搜索(BFS)的方式为每个非根节点分配其失配后的转移位置即 fail 指向。具体做法是从根开始一层层向下扩展直到覆盖全部内部顶点为止。每当从当前考察对象出发沿某条边e到达另一端v时,若发现 v 已经被访问过则直接令 `fail[v]=get_fail(u)` 后更新其他属性如 end 数组记录经过此处能结束几个词等信息;反之应当把 v 加入等待列表以便后续操作[^2]。 ```cpp queue<int> q; for (int i = 0; i < A; i++) { int t = tr[root][i]; if(t){q.push(t);fail[t]=root;} } while (!q.empty()) { auto t=q.front();q.pop(); for(int i=0;i<A;i++){ int j=tr[t][i]; if(!j){tr[t][i]=tr[fail[t]][i];continue;} q.push(j); fail[j]=tr[fail[t]][i]; } } ``` #### 查询过程中的应用 最后进入查询环节,此时输入待检验文本流text并通过循环读取其中各个组成成分尝试在先前搭建好的框架内定位是否存在相吻合的部分。每成功推进一位都意味着找到了至少一个公共开头片段,与此同时借助之前设定好的辅助机制(比如end[])统计出实际命中次数作为输出结果的一部分呈现出来[^3]。 ```cpp int query(string str) { int res=0,p=root; for(char ch:str){ int d=ch-'a'; p=tr[p][d]; int temp=p; while(temp!=root){ res+=cnt[temp]; cnt[temp]=0;//防止重复计算 temp=fail[temp]; } } return res; } ``` 上述代码展示了如何运用AC自动机解决洛谷P3167的问题核心部分———即构造Trie图、设置失效函数以及执行查找任务的具体流程。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值