传送门:HDU 5008
题意:给出一个字符串和q次询问,每次问字典序第k小的子串是哪个,若有多个字典序相同的第k小字符串,输出起始点最小的那个。
思路:后缀数组经典应用之一有求一个字符串的不同子串个数,由于后缀数组的后缀都是按字典序排好序的,因此每个后缀贡献的子串也是排好序的,这样我们可以搞一个不同子串个数的前缀和数组,然后就可以二分求出一个解来了,但是这个解不一定是起始点最小的解,因此我们还要在height数组上继续向下枚举,假设找出来的解长度为len,那么只要height[i] >= len我们就能继续向下找,枚举的过程中更新一下答案就好了。
还有一种把枚举换成了二分 + rmq的做法,看起来很骚,实际上还不如枚举快(可能是数据原因)。代码见:点击打开链接
代码:
#include<bits/stdc++.h>
#define ll long long
#define inf 0x3f3f3f3f
#define showtime printf("time = %.15f\n",clock() / (double)CLOCKS_PER_SEC);
using namespace std;
const int MAXN = 100010;
int t1[MAXN], t2[MAXN], c[MAXN];
int ra[MAXN], height[MAXN];
int sa[MAXN];
char str[MAXN];
int n;
/*
待排序数组长度为n,放在0~n-1中,在最后面补一个0
da(str, sa, ra, height, n, );//注意是n;
ra即为rank数组
例如:
n = 8;
字符串存在num[0,n-1]
num[] = { 1, 1, 2, 1, 1, 1, 1, 2, $ };注意num最后一位为0,其他大于0
ra[] = { 4, 6, 8, 1, 2, 3, 5, 7, 0 };ra[0~n-1]为有效值,ra[n]必定为0无效值
sa[] = { 8, 3, 4, 5, 0, 6, 1, 7, 2 };sa[1~n]为有效值,sa[0]必定为n是无效值
height[]= { 0, 0, 3, 2, 3, 1, 2, 0, 1 };height[2~n]为有效值
*/
bool cmp(int *r, int a, int b, int l)
{
return r[a]==r[b]&&r[a+l]==r[b+l];
}
void da(char str[], int sa[], int ra[], int height[], int n, int m)
{
n++;
int i, j, p, *x = t1, *y = t2;
for(i = 0; i < m; i++) c[i] = 0;
for(i = 0; i < n; i++) c[x[i]=str[i]]++;
for(i = 1; i < m; i++) c[i] += c[i-1];
for(i = n-1; i >= 0; i--) sa[--c[x[i]]] = i;
for(j = 1; j <= n; j<<=1)
{
p = 0;
for(i = n-j; i < n; i++) y[p++] = i;
for(i = 0; i < n; i++) if(sa[i] >= j) y[p++] = sa[i]-j;
for(i = 0; i < m; i++) c[i] = 0;
for(i = 0; i < n; i++) c[x[y[i]]]++;
for(i = 1; i < m; i++) c[i] += c[i-1];
for(i = n-1; i >= 0; i--) sa[--c[x[y[i]]]] = y[i];
swap(x, y);
p = 1; x[sa[0]] = 0;
for(i = 1; i < n; i++)
x[sa[i]] = cmp(y, sa[i-1], sa[i], j) ? p-1 : p++;
if(p >= n) break;
m = p;
}
int k = 0;
n--;
for(i = 0; i <= n; i++) ra[sa[i]] = i;
for(i = 0; i < n; i++)
{
if(k) k--;
j = sa[ra[i]-1];
while(str[i+k]==str[j+k]) k++;
height[ra[i]] = k;
}
}
ll num[MAXN];//不同字符串个数前缀和数组
int main()
{
int q, n, l, r;
ll k;
while(~scanf("%s", str))
{
n = strlen(str);
da(str, sa, ra, height, n, 128);
for(int i = 1; i <= n; i++)
num[i] = num[i - 1] + n - sa[i] - height[i];
scanf("%d", &q);
l = r = 0;
while(q--)
{
scanf("%lld", &k);
k = (k ^ l ^ r) + 1;
if(k > num[n]){
l = r = 0;//这里不要忘了赋值
printf("0 0\n"); continue;
}
int id = lower_bound(num + 1, num + n + 1, k) - num;
k -= num[id - 1];
l = sa[id];
r = sa[id] + height[id] - 1 + k;
int len = r - l + 1;
for(int i = id + 1; i <= n; i++)
{
if(height[i] >= len)
{
if(sa[i] < l)
l = sa[i], r = sa[i] + len - 1;
}
else break;
}
printf("%d %d\n", ++l, ++r);//从0...n-1下标转换到1...n
}
}
return 0;
}