这是我之前博客里提到的一道AC自动机的练手题,但是要完成这道题,我之前博客里提到的东西还不够,这里总结一下这道题。
这道题不是一般的裸的AC自动机,它的询问和插入是交叉出现的所以用我之前写的板子不大合适,这道题在构建自动机时不能改变原有的 Trie树 的结构,所以没有代表字符串的结点的不需要去改它的值,所以我在 build() 函数 处做了一些修改。在复杂度方面,如果是强上普通的AC自动机,最差会达到O(n^2),感觉不太好。我们这里可以用到平方分割的套路,搞大小两个自动机,每次插入都在小自动机上进行,当小自动机里的结点达到一定量(sqrt(n))时,就将两自动机合并,并将小自动机清空。合并的方式也很好理解,就将两个自动机的节点一一对应,若小自动机上的结点在大自动机上没有,就在大自动机上新建结点,并修改它的值。总复杂度大概是这样:O(n*sqrt(n)(小的)+O(sqrt(n)*n)(大的)=O(n*sqrt(n))。其实那个上界也不一定要严格的根号n,自己大概估计一个常数就差不多了。哦对,还有一点,我发现好多板子里在构建新结点时都打了一个 newnode() 函数,包括我自己的板子也是这么打的。这样打其实是很慢的,我在做这道题时就各种 T飞 ,后来把这个去掉搞成其他的方法就快了很多(虽然我也不知道为什么),下面的代码里会体现。
祝大家切题愉快
#include<iostream>
#include<cstdio>
#include<cstdlib>
#include<cstring>
#include<algorithm>
#include<queue>
#define maxn (511111)
#define N (6000000)
#define il inline
#define ll long long
#define RG register
using namespace std;
char s[N],ss[N];
struct Trie{
int son[maxn][2],fail[maxn],size,root;
bool val[maxn]; //标记是否出现
il void init(){
size=1; root=0;
memset(son,0,sizeof(son));
memset(val,0,sizeof(val));
memset(fail,0,sizeof(fail));
}
il int idx(char c){ //卡常专用
return c-'0';
}
il int insert(char *s){ //插入新单词
RG int cur=root;
for(RG int i=0;s[i];i++){ //卡常小技巧,不要每次计算len
RG int id=idx(s[i]);
if( !son[cur][id] ) son[cur][id]=size++;
cur=son[cur][id];
}
val[cur]=true;
return cur;
}
il bool in(char *s){ //查询单词是否在自动机内
RG int cur=root;
for(RG int i=0;s[i];i++){
RG int id=idx(s[i]);
if( !son[cur][id] ) return false;
cur=son[cur][id];
}
return val[cur];
}
il void build(){ //构建自动机
queue<int>Q;
for(RG int i=0;i<2;i++)
if( son[root][i] ) //只加入队列,不用修改值
Q.push(son[root][i]);
while(!Q.empty()){
RG int cur=Q.front(); Q.pop();
for(RG int i=0;i<2;i++){
RG int Son=son[cur][i];
if(!Son) continue;
Q.push(Son); //同上
RG int f=fail[cur];
while(f && !son[f][i] ) f=fail[f];
fail[Son]=son[f][i];
}
}
}
il int query(char *s){ //查询次数
RG int cur=root,ans=0;
for(RG int i=0;s[i];i++){
RG int id=idx(s[i]);
while(cur && !son[cur][id] ) cur=fail[cur];
cur=son[cur][id];
RG int k=cur;
while(k){
ans+=val[k];
k=fail[k];
}
}
return ans;
}
}small,big;
il void dfs(RG int u,RG int v){ //用于合并
for(RG int i=0;i<2;i++)
if(small.son[v][i]){
RG int cur2=small.son[v][i];
if( !big.son[u][i] ){
memset(big.son[big.size],0,sizeof(big.son[big.size]));
big.son[u][i]=big.size++; //建立新结点
}
RG int cur1=big.son[u][i];
big.val[cur1] |=small.val[cur2];
dfs(cur1,cur2);
}
}
il void join(){
dfs(0,0);
small.init();
big.build();
}
int main(){
RG int Case,n;
scanf("%d",&Case);
for(RG int k=1;k<=Case;k++){
printf("Case #%d:\n",k);
scanf("%d",&n);
small.init(); big.init();
RG int l=0;
while(n--){
scanf("%s",s);
RG int len=strlen(s+1);
ss[0]=s[0];
for(RG int i=0;i<len;i++)
ss[i+1]=s[ (i+l%len+len)%len+1 ];
ss[len+1]='\0';
if(ss[0]=='+'){
if( small.in(ss+1) || big.in(ss+1) ) continue;
//若该单词已经存在就跳过
small.insert(ss+1); small.build();
if( small.size>2333 ) join();
}
else{
l=small.query(ss+1)+big.query(ss+1);
printf("%d\n",l);
}
}
}
return 0;
}
真是服了这鬼畜的缩进。。。真难看。。。