A new common sub-strings problem(后缀数组,求第K小公共子串)

A new common sub-strings problem

Time Limit:1000MS  Memory Limit:65536K
Total Submit:7 Accepted:2

Description

一个字符串中一段连续的若干个字符称作这个字符串的“子串”,如果一个字符串同时是另外两个字符串的子串,就称这个字符串是另外两个字符串的“公共子串”。 

现在GBQC国的小明和小红各有一个长度在1-50000之间的字符串,他们需要你帮忙找一下这两个字符串的字典序第K小的公共子串。 

Input

输入包含多组测试数据。 

每组数据的第一行包含一个正整数K(1<=K<=10^8),表示你需要找出两个字符串的字典序第K小的公共子串。接下来两行各包含一个长度在1-50000之间只包含小写字母的字符串,分别表示这两个字符串。 

Output

对于每组数据用一行输出这两个字符串的字典序第K小的公共子串。如果两个字符串的公共子串的个数小于K,则输出“-1”(不包括引号)。

Sample Input

1
ab
abab
2
ab
abab
3
ab
abab
4
ab
abab

Sample Output

a
ab
b
-1

Hint

由于数据量较大,推荐使用scanf和printf。

/*
思路:求出height数组后,公共子串就已经排序好,当遍历到第i个公共子串的时候需要与第i - 1个进行比较,
减去这两个公共子串中重复子串的个数就是新增加的子串数
*/

#include <iostream>
#include <cstdio>
#include <cstring>
using namespace std;
const int nMax = 50010 * 2;
char s[nMax];
int num[nMax];
int K, N;
int len1, len2;
int wa[nMax],wb[nMax],wv[nMax],wz[nMax];
int rank[nMax],height[nMax], sa[nMax];
int cmp(int *r,int a,int b,int l)
{
	return r[a]==r[b]&&r[a+l]==r[b+l];
}
void da(int *r,int *sa,int n,int m)
{
	int i,j,p,*x=wa,*y=wb,*t;
	for(i=0;i<m;i++) wz[i]=0;
	for(i=0;i<n;i++) wz[x[i]=r[i]]++;
	for(i=1;i<m;i++) wz[i]+=wz[i-1];
	for(i=n-1;i>=0;i--) sa[--wz[x[i]]]=i;
	for(j=1,p=1;p<n;j*=2,m=p)
	{
		for(p=0,i=n-j;i<n;i++) y[p++]=i;
		for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;
		for(i=0;i<n;i++) wv[i]=x[y[i]];
		for(i=0;i<m;i++) wz[i]=0;
		for(i=0;i<n;i++) wz[wv[i]]++;
		for(i=1;i<m;i++) wz[i]+=wz[i-1];
		for(i=n-1;i>=0;i--) sa[--wz[wv[i]]]=y[i];
		for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++)
			x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
	}
	return;
}

void calheight(int *r,int *sa,int n)
{
	int i,j,k=0;
	for(i=1;i<=n;i++) rank[sa[i]]=i;
	for(i=0;i<n;height[rank[i++]]=k)
		for(k?k--:0,j=sa[rank[i]-1];r[i+k]==r[j+k];k++);
		return;
}

bool check(int a, int b)
{
	if(a < len1 && b > len1 || b < len1 && a > len1)
		return 1;
	return 0;
}

int fmin(int a, int b)
{
	return a < b ? a : b;
}

int main()
{
	//freopen("e://data.in", "r", stdin);
	while(scanf("%d", &K) != EOF)
	{
		scanf("%s", s);
		int i;
		len1 = strlen(s);
		for(i = 0; i < len1; ++ i)
			num[i] = s[i];
		N = len1;
		num[len1] = '#';
		scanf("%s", s);
		len2 = strlen(s);
		for(i = 0; i < len2; ++ i)
			num[len1 + 1 + i] = s[i];
		num[len1 + len2 + 1] = 0;
		N = len1 + len2 + 2;
		memset(height, 0, sizeof(height));
		da(num, sa, N, 260);
		calheight(num, sa, N - 1);//height[]中真正的数据到N - 1
		int pre = 0,
			ans = 0,
			flag = 0;
		for(i = 2; i < N; ++ i)
		{
			pre = fmin(pre, height[i]);
			if(check(sa[i], sa[i - 1]))
			{
				if(height[i] - pre >= K)
				{
					int p, q;
					for(p = sa[i], q = 0; q < pre + K; p ++, q ++)
						printf("%c", num[p]);
					printf("\n");
					flag = 1;
					break;
				}
				K -= height[i] - pre;
				pre = height[i];
			}
		}
		if(flag == 0)
			printf("-1\n");
	}
	return 0;
}


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值