后缀数组二·重复旋律2

我们知道一个音乐旋律被表示为长度为 N 的数构成的数列。

旋律可以表示为一段连续的数列,相似的旋律在原数列不可重叠,比如在1 2 3 2 3 2 1 中 2 3 2 出现了一次,2 3 出现了两次,如何知道一段旋律中出现次数至少为两次的旋律最长是多少?

输入

第一行一个整数 N。1≤N≤100000

接下来有 N 个整数,表示每个音的数字。1≤数字≤1000

输出

一行一个整数,表示答案。

样例输入
8
1 2 3 2 3 2 3 1
样例输出
2
解法提示:

这次的问题被称为最长不可重叠重复子串问题。

但是这一次是不可以重叠的。

可以二分答案,转化成判定问题。我们先二分一个k,表示我们假设串中存在长度为k的不可重叠重复子串。

存在长度为k的不可重复子串等价于存在两个后缀有长度为k的公共前缀(这里没有要求不重叠)。我们检查 height 数组中有哪些值 ≥ k。并且如果有连续的height值 ≥ k,就把对应的后缀分在同一组。这样就保证了该组中所有后缀两两之间的最长公共前缀都是不小于k的。

我们以样例为例,看一下k=2和k=3的情况。

x i height k=2 k=3
1 8 0    
1 2 3 2 3 2 3 1 1 1    
2 3 1 6 0    
2 3 2 3 1 4 2 >=2  
2 3 2 3 2 3 1 2 4 >=2 >=3
3 1 7 0    
3 2 3 1 5 1    
3 2 3 2 3 1 3 3 >=2 >=3

可以看出,当k=2时,"231"和"23231"的公共前缀大于等于k,"23231"和"2323231"的公共前缀也大于等k,所以这3个排名连续的后缀会被分到一组。同理"3231"和"323231"也会被分到一组。

对于k=3,"23231"和"2323231"分到一组,"3131"和"323231"分到一组。

对于每一组,我们检查这些后缀对应的sa值(也就是后缀起点在原串中的位置i)。如果max{sa} - min{sa} >= k,那么就说明我们能找出一组不重叠的重复子串。

例如对于k=3,"23231"和"2323231"的sa值是4和2,"3131"和"323231"这一组的sa值是5和3,差值都不满足大于等于3,所以找不出不重叠的。

对于k=2,第一组max{sa}-min{sa}=6-2=4满足大于等于2,所以能找出不重叠的。

关于后缀数组的详细解说,请参考
http://blog.csdn.net/yxuanwkeith/article/details/50636898

#include <iostream>
#include <cstdio>
#include <cstdlib>
#include <string>
#include <algorithm>
using namespace std;

//FILE *stream;

const int N = 100000 + 50;
int SA[N];//后缀数组,保存排序后后缀字符串的开头位置,本身下标对应名次
int RANK[N];//名次数组,保存排序后后缀字符串名次,本身下标对应字符串开头位置
int HEIGHT[N];//排名相邻的两个后缀的最长公共前缀
int wa[N], wb[N], wss[N], wv[N];
int aa[N];
int n;
int minsa = 1;
int maxsa = 1;

bool check(int k)
{
	for (int i = 1; i <= n; i++)
	{
		if (HEIGHT[i]< k)
		{
			minsa = SA[i];
			maxsa = SA[i];
		}
		else
		{
			minsa = min(minsa, SA[i]);
			maxsa = max(maxsa, SA[i]);
			if (maxsa - minsa >= k)
				return true;
		}
	}
	return false;
}

int cmp(int *r, int a, int b, int l)
{
	return (r[a] == r[b]) && (r[a + l] == r[b + l]);
}

void getSA(int *r, int *sa, int n, int m)//r[]为初始输入,可以对应改为字符串数组,sa[]为后缀数组,n为输入个数+1,m为输入中的最大值,字符的话可以对应改为ascii码最大值
{

	int i, j, p, *x = wa, *y = wb, *t;
	for (i = 0; i<m; i++) wss[i] = 0;
	for (i = 0; i<n; i++) wss[x[i] = r[i]]++;
	for (i = 1; i<m; i++) wss[i] += wss[i - 1];
	for (i = n - 1; i >= 0; i--) sa[--wss[x[i]]] = i;
	for (j = 1, p = 1; p<n; j *= 2, m = p)
	{
		for (p = 0, i = n - j; i<n; i++) y[p++] = i;
		for (i = 0; i<n; i++) if (sa[i] >= j) y[p++] = sa[i] - j;
		for (i = 0; i<n; i++) wv[i] = x[y[i]];
		for (i = 0; i<m; i++) wss[i] = 0;
		for (i = 0; i<n; i++) wss[wv[i]]++;
		for (i = 1; i<m; i++) wss[i] += wss[i - 1];
		for (i = n - 1; i >= 0; i--) sa[--wss[wv[i]]] = y[i]; //基数排序部分
		for (t = x, x = y, y = t, p = 1, x[sa[0]] = 0, i = 1; i<n; i++)
			x[sa[i]] = cmp(y, sa[i - 1], sa[i], j) ? p - 1 : p++;
	}
}

void getHeight(int *r, int n)
{
	int i, j, k = 0;
	for (i = 1; i <= n; i++) RANK[SA[i]] = i;
	for (i = 0; i<n; HEIGHT[RANK[i++]] = k)
		for (k ? k-- : 0, j = SA[RANK[i] - 1]; r[i + k] == r[j + k]; k++);
}

//输入aa[0]-aa[n-1]
//getSA(aa,SA,n+1,1024);    //注:此处计算出的为SA[1]-SA[n],而且每个SA值表示的是下标,从0-n-1
//getHeight(aa,n);         //注:此处计算出的为HEIGHT[1]-HEIGHT[n]

int main()
{
	//freopen_s(&stream, "in.txt", "r", stdin);

	cin >> n;
	for (int i = 0; i < n; ++i)
		cin >> aa[i];

	getSA(aa, SA, n + 1, 1024);
	getHeight(aa, n);

	int l = 0, r = n, ans = -1;
	while (l <= r)
	{
		int mid = (l + r) >> 1;
		if (check(mid))
			ans = mid, l = mid + 1;
		else r = mid - 1;
	}
	cout << ans << endl;

	//freopen_s(&stream, "CON", "r", stdin);
	//system("pause");
	return 0;
}

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值