Description
对于一个给定长度为N的字符串,求它的第K小子串是什么。
T为0则表示不同位置的相同子串算作一个。T=1则表示不同位置的相同子串算作多个。K的意义如题所述。
N<=5*10^5
T<2
K<=10^9
Solution
涨姿势了
几周不打后缀自动机又不会打了,幸好还记得性质能推一推
T=0的时候每个点的right集看做是1,T=1的时候每个点的right集为子树中叶节点数目,这个递推一下就OK
剩下的就按照当前位字典序递增dfs一下就行
发现了一个惊人事实,这题并没有-1的点
Code
#include <stdio.h>
#include <string.h>
#define rep(i,st,ed) for (int i=st;i<=ed;++i)
#define drp(i,st,ed) for (int i=st;i>=ed;--i)
#define fill(x,t) memset(x,t,sizeof(x))
#define copy(x,t) memcpy(x,t,sizeof(x))
const int N=2000005;
const int L=500005;
int rec[N][26],len[N],fa[N];
int cnt[N],rank[N],size[N],val[N];
int tot=1,last=1;
char str[L];
void insert(int ch) {
int p,q,np,nq;
p=last; last=np=++tot;
len[np]=len[p]+1; val[np]=1;
while (p&&!rec[p][ch]) {
rec[p][ch]=np;
p=fa[p];
}
if (!p) fa[np]=1;
else {
q=rec[p][ch];
if (len[q]-len[p]==1) {
fa[np]=q;
} else {
nq=++tot; len[nq]=len[p]+1;
copy(rec[nq],rec[q]);
fa[nq]=fa[q];
fa[q]=fa[np]=nq;
while (p&&rec[p][ch]==q) {
rec[p][ch]=nq;
p=fa[p];
}
}
}
}
void build(int opt) {
rep(i,1,tot) cnt[len[i]]++;
rep(i,1,tot) cnt[i]+=cnt[i-1];
// drp(i,tot,1) rank[cnt[len[i]]--]=i; 这样打实际也是对的,这里只对基数排序后相同len的顺序产生影响
rep(i,1,tot) rank[cnt[len[i]]--]=i;
drp(ti,tot,1) {
int now=rank[ti];
if (opt==0) val[now]=1;
else val[fa[now]]+=val[now];
}
val[1]=0;
drp(ti,tot,1) {
int now=rank[ti];
size[now]=val[now];
rep(i,0,25) {
size[now]+=size[rec[now][i]];
}
}
}
void dfs(int now,int k) {
if (k<=val[now]) return ;
k-=val[now];
rep(i,0,25) {
if (rec[now][i]) {
if (k<=size[rec[now][i]]) {
putchar(i+'a');
dfs(rec[now][i],k);
return ;
}
k-=size[rec[now][i]];
}
}
}
int main(void) {
freopen("data.in","r",stdin);
freopen("myp.out","w",stdout);
scanf("%s",str);
int opt,k; scanf("%d%d",&opt,&k);
int __=strlen(str);
rep(i,0,__-1) {
insert(str[i]-'a');
}
build(opt);
dfs(1,k);
return 0;
}