4032: [HEOI2015]最短不公共子串

10 篇文章 0 订阅

4032: [HEOI2015]最短不公共子串

Time Limit: 10 Sec   Memory Limit: 256 MB
Submit: 428   Solved: 207
[ Submit][ Status][ Discuss]

Description

 在虐各种最长公共子串、子序列的题虐的不耐烦了之后,你决定反其道而行之。

一个串的“子串”指的是它的连续的一段,例如bcd是abcdef的子串,但bde不是。
一个串的“子序列”指的是它的可以不连续的一段,例如bde是abcdef的子串,但bdd不是。
下面,给两个小写字母串A,B,请你计算:
(1) A的一个最短的子串,它不是B的子串
(2) A的一个最短的子串,它不是B的子序列
(3) A的一个最短的子序列,它不是B的子串
(4) A的一个最短的子序列,它不是B的子序列

Input

有两行,每行一个小写字母组成的字符串,分别代表A和B。

Output

输出4行,每行一个整数,表示以上4个问题的答案的长度。如果没有符合要求的答案,输出-1.

Sample Input

aabbcc
abcabc

Sample Output

2
4
2
4

HINT

 对于100%的数据,A和B的长度都不超过2000


Source

[ Submit][ Status][ Discuss]

等于是一道题拆成四个小题,显然要设计四种不同的算法
首先,对于B串内的所有子串,建立一棵trie,记作tb
对于A串,预处理Na[i][j]:在位置i时,下一个字符j最早出现的位置
同样,对于B串预处理Nb[i][j]
询问1:
暴力枚举A中的每个子串,看下tb中是否存在符合路径,如果没有,说明B没有这个子串
询问2:
暴力枚举A中的每个子串,同时在B中通过Nb向右跳转,显然如果B中有这个子序列,这样贪心的跳法一定能够访问到(因为给后续的字符留了尽可能多的空间),如果跳不到,就可以更新答案了
询问3:
在tb上跑一遍BFS,对于tb的每个节点,记录A的子序列中最早中哪个位置就能匹配这条路径(利用Na转移),在扩展的时候,如果tb中的节点x没有后继j,而A中对应的序列找得到这样的后继,就能更新了
询问4:
定义状态f[i][j]:A中某个子序列最后一位为i,B中某个子序列最后一位为j,它们的前缀长度最小值,转移的话利用Na和Nb就行了,当某次能转移A不能转移B,显然可以更新答案
#include<iostream>
#include<cstdio>
#include<cstring>
#include<queue>
using namespace std;

const int maxn = 2002;
const int N = 26;
const int INF = ~0U>>1;

struct Node{
	int x,y,z; Node(){}
	Node(int x,int y,int z): x(x),y(y),z(z){}
};

int na,nb,rt,cnt,f[maxn][maxn],ch[maxn * 1000][N],Na[maxn][N],Nb[maxn][N];
char A[maxn],B[maxn];

queue <Node> Q;

void Solve1()
{
	int Ans = INF;
	for (int i = 1; i <= na; i++)
	{
		int x = rt;
		for (int j = i; j <= na; j++)
		{
			x = ch[x][A[j]];
			if (!x) {Ans = min(Ans,j - i + 1); break;}
		}
	}
	if (Ans == INF) puts("-1"); else cout << Ans << endl;
}

void Solve2()
{
	int Ans = INF;
	for (int i = 1; i <= na; i++)
	{
		int x = 0;
		for (int j = i; j <= na; j++)
		{
			x = Nb[x][A[j]];
			if (!x) {Ans = min(Ans,j - i + 1); break;}
		}
	}
	if (Ans == INF) puts("-1"); else cout << Ans << endl;
}

void Solve3()
{
	bool pass = 0; Q.push(Node(1,0,0));
	while (!Q.empty())
	{
		Node k = Q.front(); Q.pop();
		for (int i = 0; i < N; i++)
			if (ch[k.x][i] && Na[k.y][i])
				Q.push(Node(ch[k.x][i],Na[k.y][i],k.z + 1));
			else if (!ch[k.x][i] && Na[k.y][i]) {pass = 1; cout << k.z + 1 << endl; break;}
		if (pass) break;
	}
	if (!pass) puts("-1");
}

void Solve4()
{
	for (int i = 0; i <= na; i++)
		for (int j = 0; j <= nb; j++)
			f[i][j] = INF;
	f[0][0] = 0; int Ans = INF;
	for (int i = 0; i <= na; i++)
		for (int j = 0; j <= nb; j++)
		{
			if (f[i][j] == INF) continue;
			for (int k = 0; k < N; k++)
			{
				if (Na[i][k] && Nb[j][k])
				{
					int &g = f[Na[i][k]][Nb[j][k]];
					g = min(g,f[i][j] + 1);
				}
				else if (Na[i][k] && !Nb[j][k]) {Ans = min(Ans,f[i][j] + 1); break;}
			}
		}
	if (Ans == INF) puts("-1"); else cout << Ans << endl;
}

int main()
{
	#ifdef DMC
		freopen("DMC.txt","r",stdin);
	#endif
	
	scanf("%s",A + 1); scanf("%s",B + 1);
	na = strlen(A + 1); nb = strlen(B + 1);
	for (int i = 1; i <= na; i++) A[i] -= 'a';
	for (int i = 1; i <= nb; i++) B[i] -= 'a';
	rt = cnt = 1;
	for (int i = 1; i <= nb; i++)
	{
		int x = rt;
		for (int j = i; j <= nb; j++)
		{
			if (!ch[x][B[j]]) ch[x][B[j]] = ++cnt;
			x = ch[x][B[j]];
		}
	}
	for (int i = na - 1; i >= 0; i--)
	{
		memcpy(Na[i],Na[i + 1],sizeof(Na[i + 1]));
		Na[i][A[i + 1]] = i + 1;
	}
	for (int i = nb - 1; i >= 0; i--)
	{
		memcpy(Nb[i],Nb[i + 1],sizeof(Nb[i + 1]));
		Nb[i][B[i + 1]] = i + 1;
	}
	Solve1(); Solve2(); Solve3(); Solve4();
	return 0;
}

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值