POJ 2217 Secretary (后缀数组,挑战程序)

题目意思:
给出两个字符串,要求两个字符串最长的公共子串(是子串不是子序列)

挑战程序设计竞赛, 383 页

本题要点:
1、高度数组,lcp[i] 表示后缀数组中,第i个字符串 S[sa[i] …] 和 第 i + 1 个字符串 S[sa[i + 1] …] 的最长公共前缀

2、 求 字符串 S 和 T 的最长公共子串, s1 = S.length()
假设一个新串: str_new = S + ‘\0’ + T; 然后求出 str_new 的高度数组 lcp[MaxN];
S 和 T 的 最长公共子串 str_common (假设有k位) 在 str_new 后缀字符串数组中(假设分别是 第i个 和 第i + 1 个),
S[sa[i] …] 和 S[sa[i + 1] …] 的前 k位 刚好是 str_common, 而且 这两个字符串 S[sa[i] …] 和 S[sa[i + 1] …]
的开始位置, 一个在 S 段,一个在 T段 ,用条件表达式也就是:
(sa[i] < s1) != (sa[i + 1] < s1)

#include <algorithm>
#include <cstdio>
#include <string>
#include <cstring>
#include <iostream>
using namespace std;
int Test;
string S, T;

const int MaxN = 10010;
int n, k;
int Rank[MaxN + 1];
int tmp[MaxN + 1];
int sa[MaxN + 1];
int lcp[MaxN + 1];

//比较字符串  (rank[i], rank[i + k]), (rank[j], rank[j + k])
bool cmp_sa(int i, int j)
{
	if(Rank[i] != Rank[j])
	{
		return Rank[i] < Rank[j];
	}else{
		int ri = i + k <= n ? Rank[i + k] : -1;
		int rj = j + k <= n ? Rank[j + k] : -1;
		return ri < rj;	
	}
}

//构造字符串 S 的后缀数组
void construct_sa(string S, int *sa)
{
	n = S.length();
	//初始长度为1, rank 直接取字符编码
	for(int i = 0; i <= n; ++i)
	{
		sa[i] = i;
		Rank[i] = i < n ? S[i] : -1;
	}
	//利用长度为k的排序的结果对长度为2k的排序
	//特别注意,这里的k是全局变量
	for(k = 1; k <= n; k *= 2)
	{
		sort(sa, sa + n + 1, cmp_sa);
		//先在tmp中临时存储新计算的rank, 在转存回rank
		tmp[sa[0]] = 0; 
		for(int i = 1; i <= n; ++i)
		{
			tmp[sa[i]] = tmp[sa[i - 1]] + (cmp_sa(sa[i - 1], sa[i]) ? 1 : 0);
		}
		for(int i = 0; i <= n; ++i)
		{
			Rank[i] = tmp[i];
		}
	}
}

//传入字符串S 和对应的后缀数组sa, 计算高度数组 lcp
void construct_lcp(string S, int *sa, int *lcp)
{
	int n = S.length();
	for(int i = 0; i <= n; ++i)
	{
		Rank[sa[i]] = i;
	}
	int h = 0;
	lcp[0] = 0;
	for(int i = 0; i < n; ++i)
	{
		//计算字符串中从位置i开始的后缀及其在后缀数组中的前一个后缀 的 lcp
		int j = sa[Rank[i] - 1];
		if(h > 0)
		{
			--h;	
		}
		for( ; j + h < n && i + h < n; ++h)
		{
			if(S[j + h] != S[i + h])
			{
				break;
			}
		}
		lcp[Rank[i] - 1] = h;
	}
}


void solve()
{
	int s1 = S.length();
//	printf("S = %s, T = %s\n", S.c_str(), T.c_str());
	S += '\0' + T;
	construct_sa(S, sa);
	construct_lcp(S, sa, lcp);
	int len = S.length();
	int ans = 0;
	for(int i = 0; i < len; ++i)
	{
		if((sa[i] < s1) != (sa[i + 1] < s1)) //分别属于 S和T的不同的字符串的后缀 lcp 的最大值,就是 S和T的最大公共子串	
		{
			ans = max(ans, lcp[i]);
		}
	}
	printf("Nejdelsi spolecny retezec ma delku %d.\n", ans);
}

int main()
{
	scanf("%d", &Test);
	getchar();
	while(Test--)
	{
		getline(cin, S);
		getline(cin, T);
		solve();
	}
	return 0;
}


/*
2
Tady nejsou zadni mimozemstani.
Lide tady take nejsou.
Ja do lesa nepojedu.
V sobotu pojedeme na vylet.
*/

/*
Nejdelsi spolecny retezec ma delku 7.
Nejdelsi spolecny retezec ma delku 5.
*/

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值