洛谷 P2852 [USACO06DEC]Milk Patterns G(后缀数组,height数组)

[USACO06DEC]Milk Patterns G

题目描述

农夫John发现他的奶牛产奶的质量一直在变动。经过细致的调查,他发现:虽然他不能预见明天产奶的质量,但连续的若干天的质量有很多重叠。我们称之为一个“模式”。 John的牛奶按质量可以被赋予一个0到1000000之间的数。并且John记录了N(1<=N<=20000)天的牛奶质量值。他想知道最长的出现了至少K(2<=K<=N)次的模式的长度。比如1 2 3 2 3 2 3 1 中 2 3 2 3出现了两次。当K=2时,这个长度为4。

输入格式

Line 1: Two space-separated integers: N and K

Lines 2…N+1: N integers, one per line, the quality of the milk on day i appears on the ith line.

输出格式

Line 1: One integer, the length of the longest pattern which occurs at least K times

样例 #1

样例输入 #1

8 2
1
2
3
2
3
2
3
1

样例输出 #1

4
1、每个数的范围是 0~1e6,  而一共n(<= 2e4) 个数,简单做个离散化


2、出现至少K次意味着后缀排序后有至少连续K个后缀以这个子串作为公共前缀。
	假如当前长度是len, 查看有没有K个子串,长度超过len, 就扫描 height 数组,
	看看是否出现连续 K - 1个 height值 超过 len.

3、 二分 子串的长度 len 就行了
#include <bits/stdc++.h>
using namespace std;
const int M = 2e6 + 10, N = 1e5 + 10;
int a[N];
int mp[M], cnt;

int s[N];	// s[] 数组存放离散化后的数据
int n, m;	//n是后缀个数, m是桶的个数
int K;
int x[N];	//桶数组
int y[N];	//辅助数组
int c[N];	//计数数组
int sa[N];	//sa[k] 表示排名为k的数组后缀编号
int rk[N];	//rk[k] 表示后缀字符串k 的排名
int height[N];	// heght[k] = lcp(sa[i], sa[i - 1])

void get_sa()
{
	int i, k;
	// 按第一个字母排序
	for(i = 1; i <= n; ++i)	// 按第一个字母编桶号, 并累计
		c[(x[i] = s[i])]++;
	for(i = 1; i <= m; ++i)	
		c[i] += c[i - 1];
	for(i = n; i; --i)		//后缀i的排序是i 所在桶号的剩余累计值
		sa[c[x[i]]--] = i;

	for(k = 1; k <= n; k <<= 1)	// logn 轮
	{
		// 按第二关键字排序
		memset(c, 0, sizeof c);
		for(i = 1; i <= n; ++i)	y[i] = sa[i];
		for(i = 1; i <= n; ++i)	c[x[y[i] + k]]++;
		for(i = 1; i <= m; ++i) c[i] += c[i - 1];
		for(i = n; i; i--) sa[c[x[y[i] + k]]--] = y[i];

		//按第一关键字排序
		memset(c, 0, sizeof c);
		for(i = 1; i <= n; ++i)	y[i] = sa[i];
		for(i = 1; i <= n; ++i)	c[x[y[i]]]++;
		for(i = 1; i <= m; ++i)	c[i] += c[i - 1];
		for(i = n; i; --i)	sa[c[x[y[i]]]--] = y[i];

		//把后缀放入桶数组
		for(i = 1; i <= n; ++i)	y[i] = x[i];
		for(m = 0, i = 1; i <= n; ++i)
		{
			if(y[sa[i]] == y[sa[i - 1]] && y[sa[i] + k] == y[sa[i - 1] + k])
				x[sa[i]] = m;
			else
				x[sa[i]] = ++m;	// 相邻后缀的关键字不相等则放入新桶
		}
		if(m == n)	
			break;
	}
}

// 定理 height[rk[i]] >= height[rk[i - 1]] - 1;
void get_height()
{
	for(int i = 1; i <= n; ++i)
		rk[sa[i]] = i;
	for(int i = 1, k = 0; i <= n; ++i)	//枚举后缀i
	{
		if(rk[i] == 1)	continue;		//第一名height 为0
		if(k) k--;						//上一个后缀的height 值减 1
		int j = sa[rk[i] - 1];			//找出后缀i的前邻后缀 j
		while(i + k <= n && j + k <= n && s[i + k] == s[j + k])
			k++;
		height[rk[i]] = k;
	}
}


// 判断长度为mid 的子串能否出现K 次
bool judge(int mid)
{
	int count = 0;
	for(int i = 2; i <= n; ++i)
	{
		if(height[i] >= mid)
		{
			count++;
			if(count >= K - 1)	// 找到连续K个,长度至少为 mid 的子串
				return true;
		}else{
			count = 0;
		}
	}
	return false;
}

int main()
{
	scanf("%d%d", &n, &K);
	for(int i = 1; i <= n; ++i)
	{
		scanf("%d", &a[i]);
		if(mp[a[i]] == 0)
		{
			mp[a[i]] = ++cnt;
		}
		s[i] = mp[a[i]];
	}
	m = cnt;
	get_sa();
	get_height();	
	int l = 1, r = n;
	while(l < r)
	{
		int mid = (l + r) >> 1;
		if(judge(mid) == false)
		{
			r = mid;	
		}else{
			l = mid + 1;
		}
	}
	printf("%d\n", l - 1);
	return 0;
}
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值