浅谈AC自动机 个人模板与说明

在下曾学习于 AC自动机详细讲解

必备技能: trie + KMP

1. 结构体

cnt记录该结点的单词数,fail失配,son为子结点

struct node{
    ll cnt,fail,son[26];
}a[manx];

2. 添加模式串

void add(string s){
    ll n=s.size(),u=1,v;
    for(int i=0;i<n;i++){
        v=s[i]-'a';
        if(!a[u].son[v]) a[u].son[v]=++id;
        u=a[u].son[v];
    }
    a[u].cnt++;
}

3. 求失配指针

id为结点编号,因为以1为根扩展出26个结点,所以从1开始编号
用数组q+双指针模拟队列
fail其实就是指向最长当前字符串的后缀
有两种情况: a[u].son[i] 存在与否
如果存在直接bfs即可,不存在的话需要把a[u].son[i]的falil指向u的失配指针的同一个字母儿子,这样可以保证a[u].son[i]指向一个实际存在的结点,使树成为trie图。

ll id=1,q[manx];
void getfail(){
    for(int i=0;i<26;i++) a[0].son[i]=1; //初始化0的所有儿子都是1
    ll l=0,r=1; q[1]=1, a[1].fail=0;   
    while(l<r){
        ll u=q[++l];
        for(int i=0;i<26;i++){
            ll f=a[u].fail; ll v=a[u].son[i];
            if(!v){ a[u].son[i]=a[f].son[i]; continue; }
            a[v].fail=a[f].son[i];
            q[++r]=v;
        }
    }
}

4. 匹配文本串

跟trie一样的操作即可,中间多了转移指针和防止重复走而打上-1的操作。

ll query(string s){
    ll ans=0,n=s.size(),u=1;
    for(int i=0;i<n;i++){
        ll v=s[i]-'a';
        ll k=a[u].son[v];
        while(k>1&&a[k].cnt!=-1){
            ans+=a[k].cnt; a[k].cnt=-1; k=a[k].fail;
        }
        u=a[u].son[v];
    }
    return ans;
}

ends:模板1 统计出现的模式串个数

const int manx=2e6+5;

struct node{
    ll cnt,fail,son[26];
}a[manx];
ll id=1,q[manx];

void add(string s){
    ll n=s.size(),u=1,v;
    for(int i=0;i<n;i++){
        v=s[i]-'a';
        if(!a[u].son[v]) a[u].son[v]=++id;
        u=a[u].son[v];
    }
    a[u].cnt++;
}
void getfail(){
    for(int i=0;i<26;i++) a[0].son[i]=1;
    ll l=0,r=1; q[1]=1, a[1].fail=0;
    while(l<r){
        ll u=q[++l];
        for(int i=0;i<26;i++){
            ll f=a[u].fail; ll v=a[u].son[i];
            if(!v){ a[u].son[i]=a[f].son[i]; continue; }
            a[v].fail=a[f].son[i];
            q[++r]=v;
        }
    }
}
ll query(string s){
    ll ans=0,n=s.size(),u=1;
    for(int i=0;i<n;i++){
        ll v=s[i]-'a';
        ll k=a[u].son[v];
        while(k>1&&a[k].cnt!=-1){
            ans+=a[k].cnt; a[k].cnt=-1; k=a[k].fail;
        }
        u=a[u].son[v];
    }
    return ans;
}
int main(){
    io; ll p; cin>>p; string s;
    while(p--) cin>>s,add(s);
    getfail();
    cin>>s;
    cout<<query(s)<<endl;
    return 0;
}

ends:模板2 统计出现次数最多的模式串(带初始化)

#include<bits/stdc++.h>
#define mp make_pair
#define pb push_back
#define ll long long
#define fi first
#define se second
#define inf 0x3f3f3f3f
#define io std::ios::sync_with_stdio(false),cin.tie(0),cout.tie(0)
using namespace std;
const int mo=998244353; const int mod=1000000007;

const int manx=2e6+5;

struct node{
    ll flag,fail,son[26];
    void clear(){memset(son,0,sizeof(son));fail=flag=0;}
}a[manx];
ll id=1,q[manx],cnt,vis[manx];
string c[manx];

void add(string s){
    ll n=s.size(),u=1,v;
    for(int i=0;i<n;i++){
        v=s[i]-'a';
        if(!a[u].son[v]) a[u].son[v]=++id;
        u=a[u].son[v];
    }
    a[u].flag=cnt;
}
void getfail(){
    for(int i=0;i<26;i++) a[0].son[i]=1;
    ll l=0,r=1; q[1]=1, a[1].fail=0;
    while(l<r){
        ll u=q[++l];
        for(int i=0;i<26;i++){
            ll v=a[u].son[i]; ll f=a[u].fail;
            if(!v){ a[u].son[i]=a[f].son[i]; continue; }
            a[v].fail=a[f].son[i];
            q[++r]=v;
        }
    }
}
void query(string s){
    ll n=s.size(),u=1;
    for(int i=0;i<n;i++){
        ll v=s[i]-'a';
        ll k=a[u].son[v];
        while(k>1){
            if(a[k].flag) vis[a[k].flag]++;
            k=a[k].fail;
        }
        u=a[u].son[v];
    }
}
void init(){
    for(int i=0;i<=id;i++) a[i].clear();
    for(int i=1;i<=id;i++) vis[i]=0;
    id=1;
}
int main(){
    io; ll p;
    while(cin>>p&&p){
        init();
        for(cnt=1;cnt<=p;cnt++) cin>>c[cnt],add(c[cnt]);
        getfail();
        string s; cin>>s;
        query(s);
        ll ans=0;
        for(int i=1;i<=p;i++)
            if(vis[i]>ans) ans=vis[i];
        cout<<ans<<endl;
        for(int i=1;i<=p;i++)
            if(vis[i]==ans) cout<<c[i]<<endl;
    }
    return 0;
}

ends:模板3 统计每个模式串出现次数(拓扑优化实现结点至多访问一次,dp延迟累加计算贡献)

#include<bits/stdc++.h>
#define mp make_pair
#define pb push_back
#define ll long long
#define fi first
#define se second
#define inf 0x3f3f3f3f
#define io std::ios::sync_with_stdio(false),cin.tie(0),cout.tie(0)
using namespace std;
const int mo=998244353; const int mod=1000000007;

const int manx=2e6+5;

struct node{
    ll flag,fail,son[26],ans;
    void clear(){memset(son,0,sizeof(son));fail=flag=0;}
}a[manx];
ll id=1,q[manx],cnt,dp[manx],d[manx],vis[manx];
string c[manx];

void add(string s){
    ll n=s.size(),u=1,v;
    for(int i=0;i<n;i++){
        v=s[i]-'a';
        if(!a[u].son[v]) a[u].son[v]=++id;
        u=a[u].son[v];
    }
    if(!a[u].flag) a[u].flag=cnt;
    vis[cnt]=a[u].flag;
}
void getfail(){
    for(int i=0;i<26;i++) a[0].son[i]=1;
    ll l=0,r=1; q[1]=1, a[1].fail=0;
    while(l<r){
        ll u=q[++l];
        for(int i=0;i<26;i++){
            ll v=a[u].son[i]; ll f=a[u].fail;
            if(!v){ a[u].son[i]=a[f].son[i]; continue; }
            a[v].fail=a[f].son[i];  d[a[v].fail]++;
            q[++r]=v;
        }
    }
}
void query(string s){
    ll n=s.size(),u=1;
    for(int i=0;i<n;i++){
        ll v=s[i]-'a';
        u=a[u].son[v];
        a[u].ans++;
    }
}
void tp(){
    ll l=0,r=0;
    for(int i=1;i<=id;i++) if(!d[i]) q[++r]=i;
    while(l<r){
        ll u=q[++l];
        dp[a[u].flag]=a[u].ans;
        ll v=a[u].fail; a[v].ans+=a[u].ans; d[v]--;
        if(!d[v]) q[++r]=v;
    }
}
int main(){
    io; ll p;
    cin>>p;
    for(cnt=1;cnt<=p;cnt++) cin>>c[cnt],add(c[cnt]);
    getfail();
    string s; cin>>s;
    query(s);
    tp();
    for(int i=1;i<=p;i++)
        cout<<dp[vis[i]]<<endl;
    return 0;
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值