这是一道简单的 AC 自动机模板题,用于检测正确性以及算法常数。
题目描述
给定 nn 个模式串 s_isi 和一个文本串 tt,求有多少个不同的模式串在文本串里出现过。
两个模式串不同当且仅当他们编号不同。
输入格式
第一行是一个整数,表示模式串的个数 nn。
第 22 到第 (n + 1)(n+1) 行,每行一个字符串,第 (i + 1)(i+1) 行的字符串表示编号为 ii 的模式串 s_isi。
最后一行是一个字符串,表示文本串 tt。
输出格式
输出一行一个整数表示答案。
输入输出样例
输入 #1复制
3 a aa aa aaa
输出 #1复制
3
输入 #2复制
4 a ab ac abc abcd
输出 #2复制
3
输入 #3复制
2 a aa aa
输出 #3复制
2
说明/提示
样例 1 解释
s_2s2 与 s_3s3 编号(下标)不同,因此各自对答案产生了一次贡献。
样例 2 解释
s_1s1,s_2s2,s_4s4 都在串 abcd
里出现过。
数据规模与约定
- 对于 50\%50% 的数据,保证 n = 1n=1。
- 对于 100\%100% 的数据,保证 1 \leq n \leq 10^61≤n≤106,1 \leq |t| \leq 10^61≤∣t∣≤106,1 \leq \sum\limits_{i = 1}^n |s_i| \leq 10^61≤i=1∑n∣si∣≤106。s_i, tsi,t 中仅包含小写字母。
#include <iostream>
#include <string>
#include <queue>
using namespace std;
const int N = 1e5;
int trie[N][26];
int fail[N];
int ctword[N],ct=0;
void insert(string s)
{
int root = 0,next;
for (int i = 0; i < s.size(); i++)
{
next = s[i] - 'a';
if(!trie[root][next])
trie[root][next] = ++ct;
root = trie[root][next];
}
ctword[root]++;
}
void printtrie()
{
for (int i = 0; i <= 10; i++)
{
for (int j = 0; j < 26; j++)
{
cout << trie[i][j] << " ";
}
cout << endl;
}
}
void getFail()
{
queue<int> q;
for (int i = 0; i < 26; i++)
{
if (trie[0][i])
{
fail[trie[0][i]] = 0;
q.push(trie[0][i]);
}
}
while (!q.empty())
{
int u = q.front();
q.pop();
for (int i = 0; i < 26; i++)
{
int v = trie[u][i];
if (v)
{
q.push(v);
fail[v] = trie[v][i];
}
else
{
trie[u][i] = trie[fail[u]][i];
}
}
}
}
int query(string s)
{
int u, ans = 0;
for (int i = 0; i < s.size(); i++)
{
u = trie[0][s[i]-'a'];
for (int j = u; j != 0 && ctword[j] != -1; j = fail[j])
{
ans += ctword[j];
ctword[j] = -1;
}
}
return ans;
}
int main()
{
int t;
cin >> t;
memset(trie, 0, sizeof trie);
string s;
while (t--)
{
cin >> s;
insert(s);
}
getFail();
string fs;
cin >> fs;
cout<<query(fs);
//printtrie();
}