P3796 ac自动机 文本串中出现最多的字串

https://www.luogu.org/problemnew/show/P3796

题目描述

有N个由小写字母组成的模式串以及一个文本串T。每个模式串可能会在文本串中出现多次。你需要找出哪些模式串在文本串T中出现的次数最多。

输入输出格式

输入格式:

 

输入含多组数据。

每组数据的第一行为一个正整数N,表示共有N个模式串,1≤N≤150。

接下去N行,每行一个长度小于等于70的模式串。下一行是一个长度小于等于10^6的文本串T。

输入结束标志为N=0。

 

输出格式:

 

对于每组数据,第一行输出模式串最多出现的次数,接下去若干行每行输出一个出现次数最多的模式串,按输入顺序排列。

输入输出样例

输入样例#1: 复制

2
aba
bab
ababababac
6
beta
alpha
haha
delta
dede
tata
dedeltalphahahahototatalpha
0

输出样例#1: 复制

4
aba
2
alpha
haha
#include <iostream>
#include <cstdio>
#include <cstring>
#include <queue>
#include <algorithm>
#define maxn 1000000
using namespace std;
struct tree
{
    int fail;
    int vis[26];
    int end;
} ac[maxn];
int cnt=0;
struct node
{
    int num;
    int pos;
} ans[maxn];
string s[maxn];
bool cmp(node a,node b)
{
    if(a.num==b.num)
        return a.pos<b.pos;
    return a.num>b.num;
}
void clean(int x)
{
    memset(ac[x].vis,0,sizeof(ac[x].vis));
    ac[x].fail=0;
    ac[x].end=0;
}
void build(string s,int no)
{
    int l=s.length();
    int now=0;
    for(int i=0; i<l; i++)
    {
        if(!ac[now].vis[s[i]-'a'])
    {
        ac[now].vis[s[i]-'a']=++cnt;
            clean(cnt);
        }
        now=ac[now].vis[s[i]-'a'];
    }
    ac[now].end=no;
}
void getfail()
{
    queue<int > q;
    for(int i=0; i<26; i++)
    {
        if(ac[0].vis[i])
        {
            ac[ac[0].vis[i]].fail=0;
            q.push(ac[0].vis[i]);
        }
    }
    while(!q.empty())
    {
        int u=q.front();
        q.pop();
        for(int i=0; i<26; i++)
        {
            if(ac[u].vis[i])
            {
                ac[ac[u].vis[i]].fail=ac[ac[u].fail].vis[i];
                q.push(ac[u].vis[i]);
            }
            else
                ac[u].vis[i]=ac[ac[u].fail].vis[i];
        }
    }
}
int acquery(string s)
{
    int l=s.length();
    int now=0;
    int answer=0;
    for(int i=0; i<l; i++)
    {
        now=ac[now].vis[s[i]-'a'];
        for(int t=now; t; t=ac[t].fail)
            ans[ac[t].end].num++;
    }
    return answer;
}
int main()
{
    int n;
    while(1)
    {
        cin>>n;
        if(!n)break;
        cnt=0;
        clean(0);
        for(int i=1; i<=n; i++)
        {
            cin>>s[i];
            ans[i].num=0;
            ans[i].pos=i;
            build(s[i],i);
        }
        ac[0].fail=0;
        getfail();
        cin>>s[0];
        acquery(s[0]);
        sort(ans+1,ans+1+n,cmp);
        cout<<ans[1].num<<endl;
        cout<<s[ans[1].pos]<<endl;
        for(int i=2; i<=n; i++)//若以后的num与第一行相等 继续输出
        {
            if(ans[i].num==ans[i-1].num)
                cout<<s[ans[i].pos]<<endl;
            else
                break;
        }
    }
    return 0;
}

每个单词的结尾的ac[].end用来记录每个单词的序号,建立node结构体记录 num pos

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值