C++——AC自动机例题——文本生成器(JSOI2007)

这是一篇关于如何使用C++和AC自动机解决JSOI2007年比赛中的一道题目——文本生成器的问题。题目要求计算在给定单词集合中,GW文本生成器v6生成的固定长度文章中有多少篇是可读的(即包含至少一个已知单词)。解决方案是将问题转化为计算26的幂次减去不包含任何单词的方案数,通过构建AC自动机进行动态规划转移。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

文本生成器(JSOI2007)

题目描述

JSOI 交给队员 ZYX一个任务,编制一个称之为“文本生成器”的电脑软件:

该软件的使用者是一些低幼人群,他们现在使用的是 GW 文本生成器 v6 版。该软件可以随机生成一些文章——总是生成一篇长度固定且完全随机的文章—— 也就是说,生成的文章中每个字节都是完全随机的。

如果一篇文章中至少包含使用者们了解的一个单词,那么我们说这篇文章是可读的(我们称文章 a 包含单词 b,当且仅当单词 b 是文章 a 的子串)。但是,即使按照这样的标准,使用者现在使用的 GW 文本生成器 v6 版所生成的文章也是几乎完全不可读的。

ZYX 需要指出 GW 文本生成器 v6 生成的所有文本中可读文本的数量,以便能够成功获得 v7 更新版。你能帮助他吗?

输入格式

输入第一行包含两个正整数,分别是使用者了解的单词总数 N(N<=60),GW 文本生成器 v6 生成的文本固定长度 M 。

以下 N 行,每一行包含一个使用者了解的单词。

### AC自动机简介 AC自动机是一种用于多模式匹配的有效数据结构,能够高效处理多个模式串在一个文本中的查找问题。通过构建Trie树并引入失败指针(fail pointer),可以在O(n)时间内完成对n个字符的文本扫描,并报告所有出现的位置。 ### 构建与应用实例解析 #### 1. 基本概念介绍 为了实现高效的字符串匹配操作,在构建AC自动机之前先要创建一颗前缀树(Trie Tree)[^1]。这棵树用来存储所有的查询关键词,其中每个节点代表一个字母;根结点为空白字符。接着为每一个非根节点设置`fail`指针指向另一个节点,使得当前节点无法继续向下搜索时可以通过此链接跳转至其他位置继续尝试匹配过程。 #### 2. C++ 实现细节说明 下面展示了一个简单的基于C++语言编写的AC自动机类定义及其核心成员函数: ```cpp #include <iostream> #include <vector> #include <queue> using namespace std; const int ALPHABET_SIZE = 26; struct TrieNode { bool isEndOfWord; vector<TrieNode*> children; TrieNode* fail; TrieNode() : isEndOfWord(false), children(ALPHABET_SIZE, nullptr), fail(nullptr){} }; class ACAutomaton { private: TrieNode *root; public: ACAutomaton(); ~ACAutomaton(); void insert(const string& word); void buildFailPointer(); }; ``` 这段代码初始化了基本的数据结构——trie node以及ac automaton对象本身[^2]。接下来是具体的插入方法和构建失配指针的方法: ```cpp void ACAutomaton::insert(const string& word){ auto current = root; for(auto ch : word){ unsigned index = ch-'a'; if(!current->children[index]){ current->children[index]=new TrieNode(); } current=current->children[index]; } current->isEndOfWord=true; } void ACAutomaton::buildFailPointer(){ queue<TrieNode*> q; root->fail=nullptr;q.push(root); while (!q.empty()){ auto temp=q.front();q.pop(); for (int i=0;i<ALPHABET_SIZE;++i){ if(temp->children[i]!=nullptr){ if(temp==root) temp->children[i]->fail=root; else{ auto p=temp->fail; while(p!=nullptr && p->children[i]==nullptr)p=p->fail; if(p==nullptr) temp->children[i]->fail=root; else temp->children[i]->fail=p->children[i]; q.push(temp->children[i]); } }else if(temp != root){ temp->children[i]=temp->fail->children[i]; } } } } ``` 上述两部分实现了字典树的建立及失配指针表的计算逻辑[^3]。最后一步则是如何利用已经准备好的AC自动机来进行实际的文字检索工作: ```cpp bool search(string text,vector<string>& patterns,int m[],int &count){ count=0; auto state=root; for(int j=0;j<(int)text.size();++j){ char c=text[j]-'a'; // Move to next state according to character 'c' while(state!=root&&state->children[c]==NULL) state=state->fail; state=(state->children[c])?state->children[c]:root; // Check all suffixes of the pattern ending at this position. TrieNode *tmp_state=state; while(tmp_state!=root){ if(tmp_state->isEndOfWord){ ++m[count++]; tmp_state=tmp_state->fail; } else break; } } return true; } ``` 以上展示了完整的AC自动机构造流程及其应用场景下的具体编码实践方式[^4]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值