题意:求所有子串中第k小的子串。子串相同位置不同视为不同。
题解:后缀数组
因为k是1e5,所以根据sa排名来遍历子串,k–就可以了。在计算lcp时,用height来比较当前串的长度,因为已经排好序,所以遍历到小于就可以停止了。
a
[
]
a[]
a[]:存第
i
i
i排名后缀的最小可操作长度。
看到有用优先队列的,具体做法是将所有字符先存进去,取出时在末尾添加其后面的一个字符,再写入。同样k大一点的话就不能采用这样遍历的方法。
#define _CRT_SECURE_NO_WARNINGS
#include<iostream>
#include<cstdio>
#include<string>
#include<cstring>
#include<algorithm>
#include<queue>
#include<stack>
#include<cmath>
#include<vector>
#include<fstream>
#include<set>
#include<map>
#define ll long long
using namespace std;
const int MAXN = 100010;
int t1[MAXN], t2[MAXN], c[MAXN];//求 SA 数组需要的中间变量,不需要赋值
//待排序的字符串放在 s 数组中,从 s[0] 到 s[n-1], 长度为 n, 且最大值小于 m,
//除 s[n-1] 外的所有 s[i] 都大于 0, r[n-1]=0
//函数结束以后结果放在 sa 数组中
bool cmp(int* r, int a, int b, int l) {
return r[a] == r[b] && r[a + l] == r[b + l];
}
void da(int str[], int sa[], int rank[], int height[], int n, int m) {
n++;
int i, j, p, * x = t1, * y = t2;
//第一轮基数排序,如果 s 的最大值很大,可改为快速排序
for (i = 0; i < m; i++)c[i] = 0;
for (i = 0; i < n; i++)c[x[i] = str[i]]++;
for (i = 1; i < m; i++)c[i] += c[i - 1];
for (i = n - 1; i >= 0; i--)sa[--c[x[i]]] = i;
for (j = 1; j <= n; j <<= 1) {
p = 0;
//直接利用 sa 数组排序第二关键字
for (i = n - j; i < n; i++)y[p++] = i;//后面的 j 个数第二关键字为空的最小
for (i = 0; i < n; i++)if (sa[i] >= j)y[p++] = sa[i] - j;
//这样数组 y 保存的就是按照第二关键字排序的结果
//基数排序第一关键字
for (i = 0; i < m; i++)c[i] = 0;
for (i = 0; i < n; i++)c[x[y[i]]]++;
for (i = 1; i < m; i++)c[i] += c[i - 1];
for (i = n - 1; i >= 0; i--)sa[--c[x[y[i]]]] = y[i];
//根据 sa 和 x 数组计算新的 x 数组
swap(x, y);
p = 1; x[sa[0]] = 0;
for (i = 1; i < n; i++)
x[sa[i]] = cmp(y, sa[i - 1], sa[i], j) ? p - 1 : p++;
if (p >= n)break;
m = p;//下次基数排序的最大值
}
int k = 0;
n--;
for (i = 0; i <= n; i++)rank[sa[i]] = i;
for (i = 0; i < n; i++) {
if (k)k--;
j = sa[rank[i] - 1];
while (str[i + k] == str[j + k])k++;
height[rank[i]] = k;
}
}
int Rank[MAXN], height[MAXN], sa[MAXN];
char s[MAXN];
int r[MAXN], t, n, k, a[MAXN];
int main() {
scanf("%s%d", s, &k);
int len = strlen(s);
for (int i = 0; i < len; i++) {
r[i] = s[i];
}
r[len] = 0;
da(r, sa, Rank, height, len, 128);
//initRMQ(len);
for (int i = 1; i <= len; i++) {
a[i]++;
if (a[i] > len - sa[i]) continue;
k--;
for (int j = i + 1; j <= len; j++) {
if (height[j] >= a[i] && k) a[j]++, k--;
else break;
}
if (!k) {
for (int j = sa[i]; j < sa[i] + a[i]; j++) printf("%c", s[j]);
return 0;
}
i--;
}
puts("No such line.");
return 0;
}