动态规划之----最长公共子序列(LCS)

最新推荐文章于 2024-08-28 11:42:40 发布

steven30832

最新推荐文章于 2024-08-28 11:42:40 发布

阅读量1.8k

点赞数

本文链接：https://blog.csdn.net/steven30832/article/details/8259948

版权

编程练习专栏收录该内容

13 篇文章 0 订阅

订阅专栏

这个问题是动态规划算法中的一个经典问题，先看问题描述：

LCS:两个字符串 X和 Y，找到他们最长的公共子序列，该序列不要求是连续的。公共子序列的意思就是序列的相对顺序是不变的，但是序列不一定是连续的。

例如：

X = "BDCABA"

Y = "ABCBDAB"

他们的最长公共子序列是BCBA和BDAB，长度都为4，找到任意一个即可。

LCS问题也满足最优子结构：

定义 Xi 表示X的前I个字符组成的序列，同理得到Yj是Y的前j个字符组成的序列。

定义 z(i,j)表示Xi和Yj的最长公共子序列的长度LCS(Xi，Yj)

如此，可知：

我们要计算LCS(Xm,Yn)，则有如下情况：

1.X[m] = Y[n]，那么z(m,n) = LCS(Xm,Yn) = LCS(Xm-1,Yn-1) + 1

2.当X[m] != Y[n] ，那么z(m,n) 便是 LCS(Xm,Yn-1)和LCS(Xm-1,Yn)中较大者。

LCS也满足重叠子问题结构，计算LCS(Xm,Yn-1)和LCS(Xm-1,Yn)的时候也计算了LCS(Xm-1,Yn-1)。

因此，采用动态规划算法...

代码如下：

//	最长公共子序列 LCS 
//	Deng Chao
//	2012.12.4

#include <iostream>
#include <cstring>
using namespace std;


//	计算LCS长度并记录LCS各个字符的前驱
//	z:保存前驱记录，用于得到公共子序列
//	return:	LCS长度
int LCS(const char *x , int xl, const char *y , int yl , char **&z)
{	
	//	构造动态规划的长度记录表
	//	z 是一个 (xl+1)*(yl+1)的矩阵
	int **c = new int*[xl+1];
	z = new char*[xl+1];
	for(int i = 0 ; i <= xl ; ++i)
	{
		c[i] = new int[yl+1];
		z[i] = new char[yl+1];
	}
	
	//	初始化，很重要！
	for(int i = 0 ; i <=xl; ++i)
	{
		c[i][0] = 0;
	}
	for(int i = 0 ; i <= yl ; ++i)
	{
		c[0][i] = 0;
	}
	
	//	从1开始填充表
	for(int i = 1 ; i <= xl ; ++i)
	{
		for(int j = 1 ; j <= yl ; ++j)
		{	
			if(x[i-1] == y[j-1])
			{
				//	当前值匹配
				c[i][j] = c[i-1][j-1] + 1;
				z[i][j] = 'm';	//表示此处匹配
			}
			else
			{
				if(c[i-1][j] > c[i][j-1])
				{
					c[i][j] = c[i-1][j];
					z[i][j] = 'u';	//向上
				}
				else
				{
					c[i][j] = c[i][j-1];
					z[i][j] = 'l';	//向左
				}
			}
			
			cout<<"c["<<i<<"]["<<j<<"] = "<<c[i][j]<<endl;
		}
	}
	
	int r = c[xl][yl];
	
	//	清空临时空间
	for(int i = 0 ; i <= xl ; ++i)
	{
		delete [] c[i];
	}
	delete [] c;
	
	return r;
}

//	打印序列
void Print_LCS(const char *x , const char *y , char **z , int xl , int yl)
{
	if(0 == xl || 0 == yl)
	{
		return;
	}
	
	if('m' == z[xl][yl])
	{
		Print_LCS(x , y , z , xl-1 , yl - 1);
		cout<<x[xl-1]<<" ";
	}
	else if('u' == z[xl][yl])
	{
		Print_LCS(x , y , z , xl-1 , yl);
	}
	else
	{
		Print_LCS(x, y , z , xl , yl-1);
	}
	
	return;
}


//	test
int main()
{
	const char *x = "BDCABA";
	const char *y = "ABCBDAB";
	int xl = strlen(x);
	int yl = strlen(y);
	
	char **z = NULL ;
	int len = LCS(x , xl , y , yl , z);
	cout<<"LCS_Length = "<<len<<endl;
	Print_LCS(x , y , z , xl , yl);
}

后记：

这里描述的是找到一个最长公共子序列，而在例子中也看到可能不止一个序列，因此，如果要找到所有的最长公共子序列，应该怎么处理？？？

思路：不采用记录前缀的矩阵z，而直接采用记录长度的矩阵c

如果c[i][j] = c[i-1][j-1] + 1，则对应的值是最长公共序列的，且可以通过c[i-1][j-1]递归回溯;

如果c[i][j] = c[i-1][j] ，则该值不属于最长公共序列，但也可以通过c[i-1][j]进行回溯，c[i][j] = c[i-[j-1]的情况相同

如此可以回溯所有的可能路径，得到所有的最长公共序列。