题目
给我们一个字符串,让我们求其所有不相同的子串中按字典序排名为K的子串
分析
先用SAM跑一遍。
然后在SAM上DP。
因为从SAM的起点跑可以跑出所有的子串,所以我们用dp[i]表示从i点出发跑出的子串的个数,显然有
dp[i]=∑ j=a,z dp[ch[i,j]]+1
然后每次按照a..za..z的顺序从起点开始dfs,如果沿ch[i,j]的方向走下去的个数≤k,就沿着这个方向往下走.
否则令k=k−dp[ch[i,j]]继续dfs。
code
#include<iostream>
#include<cstdio>
#include<cstdlib>
#include<cstring>
#include<algorithm>
#include<vector>
#include<ctime>
#define LL long long
using namespace std;
const int N=100205;
int n;
int len[N*2];
int ch[N*2][30],fail[N*2];
int root,cnt,last;
void ins(int x)
{
int p,q,np,nq;
p=last; last=np=++cnt;
len[np]=len[p]+1;
for (;!ch[p][x]&&p;p=fail[p])
ch[p][x]=np;
if (p==0) fail[np]=root;
else
{
q=ch[p][x];
if (len[q]==(len[p]+1)) fail[np]=q;
else{
nq=++cnt;
len[nq]=len[p]+1;
for (int i=0;i<=26;i++) ch[nq][i]=ch[q][i];
fail[nq]=fail[q];
fail[q]=fail[np]=nq;
for (;ch[p][x]==q;p=fail[p])
ch[p][x]=nq;
}
}
}
char s[N];
int cc[N*2];
int q[N*2];
int f[N*2];
void query(int x)
{
int p=1;
while (x)
{
for (int i=0;i<26;i++)
if (ch[p][i])
{
if (f[ch[p][i]]>=x)
{
putchar('a'+i);
p=ch[p][i];
x--;
break;
}
else x-=f[ch[p][i]];
}
}
printf("\n");
}
int work()
{
scanf("%s",s);
int m=strlen(s);
last=cnt=root=1;
for (int i=0;i<m*2;i++) ins(s[i]-'a');
for (int i=1;i<=cnt;i++) ++cc[len[i]];
for (int i=1;i<=cnt;i++) cc[i]+=cc[i-1];
for (int i=1;i<=cnt;i++) q[cc[len[i]]--]=i;
for (int i=cnt;i;i--)
{
f[q[i]]=1;
for (int j=0;j<26;j++)
{
f[q[i]]+=f[ch[q[i]][j]];
}
}
int x;
scanf("%d",&x);
query(x);
}
int main()
{
work();
}