最长公共子序列详解及代码实现

一、最长公共子序列

首先区别一下子串与子序列,子串要求是连续的而子序列不要求连续。例如ABCDEG字符串, ABC为子串,ADG为子序列。


设有两个字符串数组 str1【N】和str2【M】,构建二维数组DP【N】【M】,其中DP【i】【j】的含义:字符串str1【0……i】与str2【0……j】的公共子序列的长度。

我们来分析DP【i】【j】的来源,

1、首先DP【i】【j】的值不会小于DP【i-1】【j-1】,如果str1【i】==str2【j】,则DP【i】【j】 = DP【i-1】【j-1】+1。

2、如果str1【i】!=  str2【j】,DP的来源于max( DP【i】【j-1】,DP【i-1】【j】),

此时不用考虑DP【i-1】【j-1】因为:

DP【i】【j-1】>=DP【i-1】【j-1】,

DP【i-1】【j】>=DP【i-1】【j-1】

( 没看明白可以这样考虑:

str1【0……i】与str2【0……j-1】 的公共子序列肯定不会比str1【0……i-1】与str2【0……j-1】的公共子序列小,

str1【0……i-1】与str2【0……j】的公共子序列肯定不会比str1【0……i-1】与str2【0……j-1】的公共子序列小。)

所以选取这两个最大一个即可。


明白DP【i】【j】的含义,以及DP【i】【j】的推导后,我们再来看如何构造DP【N】【M】数组。

1、首先构造第一行,

DP【0】【0……M-1】代表字符串str1【0……0】与str2【0……M-1】的最长公共子序列,

可以看出这一行的值,不为1就为0,

且当DP【0】【K】为1时(含义:str1【0】 ==str2【K】&&str1【0】!=str2【0……K-1】)   DP【0】【K+1……M-1】均为1。

2、构造第一列,

DP【0……N-1】【0】代表str1【0……N-1】与str2【0……0】的最长公共子序列,

可以看出这一列的值同第一行一样,不为1就为0,

且当DP【K】【0】为1时(含义:str1【K】 ==str2【0】&&str1【0……K-1】!=str2【0】)   DP【K+1……M-1】【0】均为1。

3、知道了第一行和第一列的值,可以根据求得其他所有矩阵中的值。



构造DP【N】【M】之后,就可以根据DP【N】【M】来求得最长公共子序列。

1、首先从右下角开始,DP【N-1】【M-1】,如果str1【N-1】 == str2【M-1】 则说明str1【N-1】一定是最长公共子序列中的一个数,得记录下来

2、如果str1【N-1】 != str2【M-1】,则不用记录str1【N-1】或str2【M-1】,这时需要向上(DP【i-1】【j】)移动或者向左

(DP【i】【j-1】)移动,看这两个值哪个大,谁大往谁的方向移。(可以这样理解,既然我们这个点str1【N-1】与str2【M-1】不同,但是此时最大递增子序列的长度应该是不变的,所以应该向DP【】【】值不变的方向移动,回想起我们在创建DP【】【】数组时,当str1【N-1】 != str2【M-1】,DP【N-1】【M-1】的来源是左边和上边其中的较大值。所以应该向左边和上边中的较大值移动)

3、每到str1【K1】 == str2【K2】  记录下str1【k1】,不相等时,向左和上的较大值移动,直到DP【K1】【k2】==0终止。


如上图的例子:str1 = “xi A B C B D A B”   str2 = "yj B D C A B A"

代码:

// write your code here cpp
#include<iostream>
#include<string>
#include<vector>

using namespace std;

int Max(int a,int b)
{
	return (a>b)?a:b;
}

void creatDp(string s1,string s2,int *dp)
{
	int len1 = s1.length();
	int len2 = s2.length();
	//int *dp = new int[len1*len2];
	//先求出第一行
	for(int j = 0;j<len2;j++)
	{
		if(s1[0] == s2[j]){
			*(dp+0*len2+j) = 1;
			for(;j<len2;j++)
				*(dp+0*len2+j) = 1;
			break;
		}
		else
		        *(dp+0*len2+j) = 0;
	}
	//然后求第一列
	for(int i = 0;i<len1;i++)
	{
		if(s1[i] == s2[0]){
			*(dp+i*len2+0) = 1;
			for(;i<len1;i++)
				*(dp+i*len2+0) = 1;
			break;
		}
		else
			*(dp+i*len2+0) = 0;
	}
	//求其他的数据
	for(int i =1;i<len1;i++)
	{
		for(int j =1;j<len2;j++)
		{
			if(s1[i] == s2[j])
				*(dp+i*len2+j) = *(dp+(i-1)*len2+(j-1))+1;
			else
				*(dp+i*len2+j) = Max(*(dp+(i-1)*len2+j),*(dp+i*len2+j-1));
		}
	}
     //这个值记录着最大公共子序列的长度
   //cout<<dp[len1*len2-1];
}

void getLCS(int *dp,string s1,string s2)
{
	int len1 = s1.length();
	int len2 = s2.length();
	int i = len1-1;
	int j = len2-1;
	int len = dp[i*len2+j];
	char *result = new char[len];
	int k =len-1;
	while(*(dp+i*len2+j)!=0&&i>=0&&j>=0){
		if(s1[i] == s2[j]){
			result[k--] = s1[i];
			i--;j--;
		}
		else
		{
			if(*(dp+(i-1)*len2+j) > *(dp+(i)*len2+j-1))
				i--;
			else
				j--;
		}
	}
	for(int i = 0;i<len;i++)
		cout<<result[i]<<" ";
	cout<<endl;
}

int main()
{
	string s1 ;
	string s2 ;
    while(cin>>s1>>s2){
        int len1 = s1.length();
        int len2 = s2.length();
        int *dp = new int[len1*len2];
        creatDp(s1, s2,dp);
        getLCS(dp,s1,s2);
	delete[] dp;
    }
	return 0;
}



测试:

abcfbc abfcab
programming contest
abcd mnp





应用:例如给你一个字符串,可以从中删除一些字符,使得剩下的串是一个回文串。如何删除才能使得回文串最长呢?

就是该字符串的大小和   该串与反串的最大公共子序列 的差值。





  • 4
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值