poj 2222 Keywords Search(AC自动机)

  传送门:Keywords Search

  题目大意:这道题是AC自动机的模板题。题目很简单,第一个数是测试样例个数。每个样例先给一个n,接下来有n个字符串,再给一个母串,问这些字符串中有多少个在母串中出现过。

  分析:此题中母串长度很长,能达到1000000,所以KMP是注定TML的,果断AC自动机。陷阱就是在n个字符串中有可能有相同字符串出现。这是很多人WA的原因。对了,这道题由于内存限制,字典树的节点开不了50W个,经测试25W可A。当然最好用指针动态申请空间要好一些。

不多说了,放代码:

#include <cstring>
#include <cstdio>
#include <queue>
using namespace std;

int t;
int n;
char ss[1100000];
int next[260010][26];                         //指向下一个节点
int c[260010];                                //记录以此结点结尾的单词个数
int fail[260010];                             //失败指针
int num;
void insert(char s[])                         //字典树中插入单词
{
    int t = 1;
    int len = strlen(s);
    for (int i=0;i<len ;i++ )
    {
        if(next[t][s[i]-'a']==0)
            next[t][s[i]-'a'] = num++;
        t = next[t][s[i]-'a'];
    }
    c[t]++;
}

void makeAC()                                 //建立字典树,构造失败指针
{
    queue<int> q;
    q.push(1);
    int t,tt;
    while(!q.empty())
    {
        t = q.front();
        q.pop();
        for (int i=0;i<26 ;i++ )
        {
            if(next[t][i])
            {
                tt = fail[t];
                while(tt)
                {
                    if(next[tt][i])
                    {
                        fail[next[t][i]] = next[tt][i];
                        break;
                    }
                    tt = fail[tt];
                }
                if(tt == 0)
                    fail[next[t][i]] = 1;
                q.push(next[t][i]);
            }
        }
    }
}

int count(char s[])                              //计数
{
    int tt;
    int n = 0,t = 1;
    int len = strlen(s);
    for (int i=0;i<len ;i++ )
    {
        if(next[t][s[i]-'a'])
            t = next[t][s[i]-'a'];
        else
        {
            while(t!=1 && next[t][s[i]-'a']==0)
                t = fail[t];
                if(t!=1 || next[t][s[i]-'a'])
                    t = next[t][s[i]-'a'];
        }
        tt = t;
        while(tt!=1 && c[tt]!=-1)               //顺着失败指针访问所有已i结尾的单词,记录单词个数
        {
            n += c[tt];
            c[tt] = -1;                         //标记节点已被访问,不再访问
            tt = fail[tt];
        }
    }
    return n;
}

int main()
{
    scanf("%d",&t);
    char s[111];
    for (int i=0;i<t ;i++ )
    {
        num = 2;
        memset(next,0,sizeof(next));
        memset(c,0,sizeof(c));
        memset(fail,0,sizeof(fail));
        scanf("%d",&n);
        for (int j=0;j<n ;j++ )
        {
            scanf("%s",s);
            insert(s);
        }
        makeAC();
        scanf("%s",ss);
        printf("%d\n",count(ss));
    }
    return 0;
}

  由于本人现在对AC自动机的了解还很肤浅,在这里就不介绍AC自动机了,有兴趣的同学可自行百度。等在做几道难点的AC自动机题再写个专栏,重点讲解一下。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值