HDU 5008 Boring String Problem 二分 + 后缀数组

22 篇文章 0 订阅
4 篇文章 0 订阅

传送门:HDU 5008

题意:给出一个字符串和q次询问,每次问字典序第k小的子串是哪个,若有多个字典序相同的第k小字符串,输出起始点最小的那个。

思路:后缀数组经典应用之一有求一个字符串的不同子串个数,由于后缀数组的后缀都是按字典序排好序的,因此每个后缀贡献的子串也是排好序的,这样我们可以搞一个不同子串个数的前缀和数组,然后就可以二分求出一个解来了,但是这个解不一定是起始点最小的解,因此我们还要在height数组上继续向下枚举,假设找出来的解长度为len,那么只要height[i] >= len我们就能继续向下找,枚举的过程中更新一下答案就好了。

还有一种把枚举换成了二分 + rmq的做法,看起来很骚,实际上还不如枚举快(可能是数据原因)。代码见:点击打开链接

代码:

#include<bits/stdc++.h>
#define ll long long
#define inf 0x3f3f3f3f
#define showtime printf("time = %.15f\n",clock() / (double)CLOCKS_PER_SEC);
using namespace std;
const int MAXN = 100010;
int t1[MAXN], t2[MAXN], c[MAXN];    
int ra[MAXN], height[MAXN];  
int sa[MAXN];    
char str[MAXN]; 
int n;  
/* 
待排序数组长度为n,放在0~n-1中,在最后面补一个0  
da(str, sa, ra, height, n, );//注意是n; 
ra即为rank数组  
例如:  
n = 8;  
字符串存在num[0,n-1]   
num[] = { 1, 1, 2, 1, 1, 1, 1, 2, $ };注意num最后一位为0,其他大于0  
ra[] = { 4, 6, 8, 1, 2, 3, 5, 7, 0 };ra[0~n-1]为有效值,ra[n]必定为0无效值  
sa[] = { 8, 3, 4, 5, 0, 6, 1, 7, 2 };sa[1~n]为有效值,sa[0]必定为n是无效值  
height[]= { 0, 0, 3, 2, 3, 1, 2, 0, 1 };height[2~n]为有效值  
  
*/    
bool cmp(int *r, int a, int b, int l)    
{    
    return r[a]==r[b]&&r[a+l]==r[b+l];    
}    
    
void da(char str[], int sa[], int ra[], int height[], int n, int m)    
{    
    n++;    
    int i, j, p, *x = t1, *y = t2;    
    for(i = 0; i < m; i++) c[i] = 0;    
    for(i = 0; i < n; i++) c[x[i]=str[i]]++;    
    for(i = 1; i < m; i++) c[i] += c[i-1];    
    for(i = n-1; i >= 0; i--) sa[--c[x[i]]] = i;    
    for(j = 1; j <= n; j<<=1)    
    {    
        p = 0;    
        for(i = n-j; i < n; i++) y[p++] = i;    
        for(i = 0; i < n; i++) if(sa[i] >= j) y[p++] = sa[i]-j;    
        for(i = 0; i < m; i++) c[i] = 0;    
        for(i = 0; i < n; i++) c[x[y[i]]]++;    
        for(i = 1; i < m; i++) c[i] += c[i-1];    
        for(i = n-1; i >= 0; i--) sa[--c[x[y[i]]]] = y[i];    
        swap(x, y);    
        p = 1; x[sa[0]] = 0;    
        for(i = 1; i < n; i++)    
            x[sa[i]] = cmp(y, sa[i-1], sa[i], j) ? p-1 : p++;    
        if(p >= n) break;    
        m = p;    
    }    
    int k = 0;    
    n--;    
    for(i = 0; i <= n; i++) ra[sa[i]] = i;    
    for(i = 0; i < n; i++)    
    {    
        if(k) k--;    
        j = sa[ra[i]-1];    
        while(str[i+k]==str[j+k]) k++;    
        height[ra[i]] = k;    
    }    
}
ll num[MAXN];//不同字符串个数前缀和数组 
int main()
{
	int q, n, l, r;
	ll k;
	while(~scanf("%s", str))
	{
		n = strlen(str);
		da(str, sa, ra, height, n, 128);
		for(int i = 1; i <= n; i++)
		num[i] = num[i - 1] + n - sa[i] - height[i];
		scanf("%d", &q);
		l = r = 0;
		while(q--)
		{
			scanf("%lld", &k);
			k = (k ^ l ^ r) + 1;
			if(k > num[n]){
				l = r = 0;//这里不要忘了赋值
				printf("0 0\n"); continue;
			}
			int id = lower_bound(num + 1, num + n + 1, k) - num;
			k -= num[id - 1];
			l = sa[id];
			r = sa[id] + height[id] - 1 + k;
			int len = r - l + 1;
			for(int i = id + 1; i <= n; i++)
			{
				if(height[i] >= len)
				{
					if(sa[i] < l)
					l = sa[i], r = sa[i] + len - 1;
				}
				else break;
			}
			printf("%d %d\n", ++l, ++r);//从0...n-1下标转换到1...n 
		}
	}
 	return 0;
}


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值