浅谈AC自动机

  

  浅谈AC(WA)自动机(无指针)

 看之前做好心理准备,写得很垃圾,大佬勿喷,本蒟蒻连省一都不是

  身为蒟蒻的我在昨天学会了KMP以后终于理解了AC自动机的原理,这里在博客里写一下给同样看不懂而且迷茫的大佬们。

  首先我们要明确一个道理,这个AC自动机不是那种用来AC每一种题目的一个bug,是一种专门用来处理字符串的模板。

  学习AC自动机你首先要学会如何使用(WA,TLE,MLE,RE....自动机)毛片算法(KMP)Trie树(字典树)。

  首先我们了解到KMP是用来解决一个模板串和一个文本串的匹配算法的。

  例如:(模板串)abacavavadad, (文本串)aba 出现的次数

  但是当我们要解决多个模板串在一个文本串中出现的次数的时候呢?先打多个KMP然后一个一个去匹配吗?这样时间复杂度很明显是显著上升的

  例如:(模板串)sheicascasdmed, (文本串)she,cas,sca,sd.. 出现的次数

  这时候我们要冷静,不能砸电脑,要膜大佬,这时候就要用到Aho-Corasick automaton。AC自动机算法分为3步:构造一棵Trie树,构造失败指针和模式匹配过程。

  

 

  是不是很复杂,没错,我当时也很懵逼。所以这个图就放着看看不管了。

  所以建议看一下一个关于AC自动机的非常有用的讲解(本蒟蒻不会讲解,一定要看)视频。

  然后我们大概一个明白了,AC自动机就是第一步建立一个字典树,

  

void build()
{
    int len=strlen(ss);//每一个模式串的长度,建立一个Trie树
    int now=0;
    for(int i=0;i<len;i++)
    {
        if(tr[now].vis[ss[i]-'a']==0)
        tr[now].vis[ss[i]-'a']=++cnt ;
        now=tr[now].vis[ss[i]-'a'];
    }
    tr[now].end+=1;//统计单词数
}

  第二步,通过KMP算法的fail指针,在Trie树上的一个单词结束后或无法匹配后指向另外一个单词的某个部分用来进行节时的查询(精髓所在)

void get()
{
    queue<int>q;
    for(int i=0;i<26;i++)
    {
        if(tr[0].vis[i]!=0)
        {
            tr[tr[0].vis[i]].fail=0;
            q.push(tr[0].vis[i]);
        }
    }
    while(!q.empty())
    {
        int u=q.front();
        q.pop();
        for(int i=0;i<26;i++)
        {
            if(tr[u].vis[i]!=0)
            {
                tr[tr[u].vis[i]].fail=tr[tr[u].fail].vis[i];
                q.push(tr[u].vis[i]);
            }
            else tr[u].vis[i]=tr[tr[u].fail].vis[i];
        }
    }
}

  第三步就是直接就把文本串放进去匹配了好吧

int query()
{
    int len=strlen(ss);
    int now=0,ans=0;
    for(int i=0;i<len;i++)
    {
        now=tr[now].vis[ss[i]-'a'];
        for(int t=now;t&&tr[t].end!=-1;t=tr[t].fail)
        {
            ans+=tr[t].end;
            tr[t].end=-1;
        }
    }
    return ans;
}

  然后就结束了,AC自动机的基本功能就是解决多个模板串在一个文本串的情况。多做题目一定有利于理解的。

  

转载于:https://www.cnblogs.com/hhh1109/p/8413365.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
毕设新项目-基于Java开发的智慧养老院信息管理系统源码+数据库(含vue前端源码).zip 【备注】 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用!有问题请及时沟通交流。 2、适用人群:计算机相关专业(如计科、信息安全、数据科学与大数据技术、人工智能、通信、物联网、自动化、电子信息等)在校学生、专业老师或者企业员工下载使用。 3、用途:项目具有较高的学习借鉴价值,不仅适用于小白学习入门进阶。也可作为毕设项目、课程设计、大作业、初期项目立项演示等。 4、如果基础还行,或热爱钻研,亦可在此项目代码基础上进行修改添加,实现其他不同功能。 欢迎下载!欢迎交流学习!不清楚的可以私信问我! 毕设新项目-基于Java开发的智慧养老院信息管理系统源码+数据库(含vue前端源码).zip毕设新项目-基于Java开发的智慧养老院信息管理系统源码+数据库(含vue前端源码).zip毕设新项目-基于Java开发的智慧养老院信息管理系统源码+数据库(含vue前端源码).zip毕设新项目-基于Java开发的智慧养老院信息管理系统源码+数据库(含vue前端源码).zip毕设新项目-基于Java开发的智慧养老院信息管理系统源码+数据库(含vue前端源码).zip毕设新项目-基于Java开发的智慧养老院信息管理系统源码+数据库(含vue前端源码).zip毕设新项目-基于Java开发的智慧养老院信息管理系统源码+数据库(含vue前端源码).zip毕设新项目-基于Java开发的智慧养老院信息管理系统源码+数据库(含vue前端源码).zip毕设新项目-基于Java开发的智慧养老院信息管理系统源码+数据库(含vue前端源码).zip
后缀自动机被广泛应用于OI竞赛中,特别是在字符串相关的问题中。它是一种高效的数据结构,能够有效地解决各种字符串匹配、模式匹配和计数等问题。 首先,后缀自动机可以用于解决最长公共子串和最长公共子序列等问题。对于给定的两个字符串,可以将其加入到后缀自动机中,并通过动态规划的方式求解最长公共子串或子序列的长度。 其次,后缀自动机还可以用于解决多次询问下的子串出现次数问题。通过构建全局后缀自动机,可以在O(n)的时间复杂度内预处理字符串,并在O(m)的时间复杂度内得出任意子串的出现次数,其中n为字符串长度,m为询问总数。 另外,后缀自动机还可以用于解决包含多模式匹配的问题。通过将模式串加入到后缀自动机中,并预处理自动机的fail指针,可以在O(n)的时间复杂度内找到所有模式串在文本中的出现位置。这在处理大规模的文本匹配问题时非常有用。 此外,后缀自动机还可以进行字符串的字典序统计。通过在构建自动机时记录每个节点的信息,可以在O(n)的时间复杂度内得到字符串的字典序第k小/大的子串。 总之,后缀自动机在OI竞赛中有着广泛的应用,能够解决各种字符串相关的问题。通过巧妙地构建自动机,并充分利用其性质,可以实现高效的字符串算法,为解决复杂的字符串问题提供了有力的工具。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值