题目
一个模式串s(|s|<=1e5),
n(n<=1e5)个询问,每次询问一个串t(|t|<=1e3)
每次询问t是不是s的子序列
思路来源
https://blog.csdn.net/gemorz/article/details/53184721
题解
建一下序列自动机,然后每次在自动机上跑一下,
类似trie树,看看是否存在即可
预处理自动机O(26*|s|),匹配O(n*t)
心得
算是学习了一下序列自动机
建子序列自动机的时候,优先出现的字母先构建
比如aaabab的ab串,就是由第一个a和第四个b建的
这样保证了不会错过后续来的字符串
此外,每次加入一个新字符时,考虑能给哪些子序列带来贡献
那么就是在以往所有的子序列后增加一个新字符即可,
只需枚举过往所有子序列的最后一个字符是什么,
而由于序列自动机的优先性,
任意一个子序列的最后一个字符x,肯定是最后一个被加入的字符x,
所以从‘a’到‘z'枚举,补到最后一个字符位置后面即可,
注意到这里许多子序列的儿子节点都是共用的一个节点,
所以这也使得若干子序列都是共用的,
补在这个节点后面就相当于补在所有以这个子节点为结尾节点的子序列后面
复杂度据说是O(n*a),但我觉得好像是O(所有本质不同子序列的长度之和)
代码1
#include<iostream>
#include<cstdio>
#include<cstring>
using namespace std;
const int maxn=1e5+10;
int n,len,rt;
char s[maxn],t[maxn];
int par[maxn];
int head[26],last[26];
int ch[maxn][26];
void add(int x)
{
par[++rt]=last[x];
if(!last[x])head[x]=rt;
for(int i=0;i<26;i++)
for(int j=last[i];j&&!ch[j][x];j=par[j])
ch[j][x]=rt;
//共用多个节点 在每个子序列的结尾后续一个 枚举上一个串的结尾的节点是哪个
//复杂度应该为 所有本质不同的子序列长度之和 毕竟是在每个后面续字符构成新序列和新的ch关系
last[x]=rt;
}
bool find(char s[])
{
int rt,len=strlen(s);
for(int i=0;i<len;++i)
{
int x=s[i]-'a';
if(!i)rt=head[x];
else rt=ch[rt][x];
if(!rt)return 0;
}
return 1;
}
//模式串s n个串t 判断t是不是s的子序列
int main()
{
scanf("%s",s);
len=strlen(s);
for(int i=0;i<len;++i)
{
int x=s[i]-'a';
add(x);
}
scanf("%d",&n);
for(int i=0;i<n;++i)
{
scanf("%s",t);
puts(find(t)?"YES":"NO");
}
return 0;
}
代码2
不妨设字符串只由小写字母构成,
Next[i][j]表示下标从i起第一次出现字母j的位置
预处理的时候倒着dp,Next[i][s[i]-'a']=i,否则Next[i][j]=Next[i+1][j]
初始时,赋状态Next[i][j]=n+1或INF
子序列匹配时,每次贪心地找到第一个字符进行匹配
预处理复杂度O(n*a),匹配复杂度O(|s|)
由于代码比较简单就不写了