后缀数组三·重复旋律3

我们知道一个音乐旋律被表示为长度为 N 的数构成的数列。

旋律是一段连续的数列,如果同一段旋律在作品A和作品B中同时出现过,这段旋律就是A和B共同的部分,比如在abab 在 bababab 和 cabacababc 中都出现过。如何知道两部作品的共同旋律最长是多少?

输入

共两行。一行一个仅包含小写字母的字符串。字符串长度不超过 100000。

输出

一行一个整数,表示答案。

样例输入
abcdefg
abacabca
样例输出
3
解法提示:

这次的问题是经典的最长公共子串问题。

以前学过kmp,但是似乎不适用这道题目。问题的关键就出在kmp求的是完整的匹配,而本题需要支持子串的匹配。

我们不妨将两个串用一个没出现过的#字符隔开。对这个拼接串求后缀数组和height 数组。

举个例子abab和a,我们对abab#a求后缀数组,得到:

suffix sa height belong
#a 5 0 /
a 6 0 a
ab#a 3 1 abab
abab#a 1 2 abab
b#a 4 0 abab
bab#a 2 1 abab

我们发现height的最大值是2,而正确答案显然是1。

由于例子中ab#a和abab#a两个后缀的开始位置同属于前一个字符串,导致计算出了前一个字符串内部的"公共子串"。

我们只需求排名相邻,原来不在同一个字符串的 height 值的最大值就行了。

这个做法可以推广到做任意多个串的最长公共子串,如果你有兴趣也可以好好想想。

关于后缀数组的详细解说,请参考
http://blog.csdn.net/yxuanwkeith/article/details/50636898

#include <iostream>
#include <cstdio>
#include <cstdlib>
#include <string>
#include <algorithm>
using namespace std;

//FILE *stream;
string s, s1, s2;
int n, k;
const int N = 200000 + 50;
int SA[N];//后缀数组,保存排序后后缀字符串的开头位置,本身下标对应名次
int RANK[N];//名次数组,保存排序后后缀字符串名次,本身下标对应字符串开头位置
int HEIGHT[N];//排名相邻的两个后缀的最长公共前缀
int wa[N], wb[N], wss[N], wv[N];

int cmp(int *r, int a, int b, int l)
{
	return (r[a] == r[b]) && (r[a + l] == r[b + l]);
}

void getSA(string r, int *sa, int n, int m)//r为初始输入,可以对应改为字符串数组,sa[]为后缀数组,n为输入个数+1,m为输入中的最大值,字符的话可以对应改为ascii码最大值
{

	int i, j, p, *x = wa, *y = wb, *t;
	for (i = 0; i<m; i++) wss[i] = 0;
	for (i = 0; i<n; i++) wss[x[i] = r[i]]++;
	for (i = 1; i<m; i++) wss[i] += wss[i - 1];
	for (i = n - 1; i >= 0; i--) sa[--wss[x[i]]] = i;
	for (j = 1, p = 1; p<n; j *= 2, m = p)
	{
		for (p = 0, i = n - j; i<n; i++) y[p++] = i;
		for (i = 0; i<n; i++) if (sa[i] >= j) y[p++] = sa[i] - j;
		for (i = 0; i<n; i++) wv[i] = x[y[i]];
		for (i = 0; i<m; i++) wss[i] = 0;
		for (i = 0; i<n; i++) wss[wv[i]]++;
		for (i = 1; i<m; i++) wss[i] += wss[i - 1];
		for (i = n - 1; i >= 0; i--) sa[--wss[wv[i]]] = y[i]; //基数排序部分
		for (t = x, x = y, y = t, p = 1, x[sa[0]] = 0, i = 1; i<n; i++)
			x[sa[i]] = cmp(y, sa[i - 1], sa[i], j) ? p - 1 : p++;
	}
}

void getHeight(string r, int n)
{
	int i, j, k = 0;
	for (i = 1; i <= n; i++) RANK[SA[i]] = i;
	for (i = 0; i<n; HEIGHT[RANK[i++]] = k)
		for (k ? k-- : 0, j = SA[RANK[i] - 1]; r[i + k] == r[j + k]; k++);
}

//输入aa[0]-aa[n-1]
//getSA(aa,SA,n+1,150);    //注:此处计算出的为SA[1]-SA[n],而且每个SA值表示的是下标,从0-n-1
//getHeight(aa,n);         //注:此处计算出的为HEIGHT[1]-HEIGHT[n]

void solve()
{
	int i, maxLen = 0;
	for (i = 2; i <= n; i++)
	{
		if ((SA[i] - k)*(SA[i - 1] - k) < 0)
		{
			if (maxLen < HEIGHT[i])
				maxLen = HEIGHT[i];
		}
	}
	cout << maxLen << endl;
}

int main()
{
	//freopen_s(&stream, "in.txt", "r", stdin);

	while(cin >> s1 >> s2)
	{
		s = s1 + '#' + s2;
		n = s.size();
		k = s1.size();
		getSA(s, SA, n + 1, 150);
		getHeight(s, n);
		solve();
	}
	//freopen_s(&stream, "CON", "r", stdin);
	//system("pause");
    return 0;
}


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值