最长公共子序列
-
描述
-
咱们就不拐弯抹角了,如题,需要你做的就是写一个程序,得出最长公共子序列。
tip:最长公共子序列也称作最长公共子串(不要求连续),英文缩写为LCS(Longest Common Subsequence)。其定义是,一个序列 S ,如果分别是两个或多个已知序列的子序列,且是所有符合此条件序列中最长的,则 S 称为已知序列的最长公共子序列。-
输入
-
第一行给出一个整数N(0<N<100)表示待测数据组数
接下来每组数据两行,分别为待测的两组字符串。每个字符串长度不大于1000.
输出
- 每组测试数据输出一个整数,表示最长公共子序列长度。每组结果占一行。 样例输入
-
2 asdf adfsd 123abc abc123abc
样例输出
-
3 6
-
第一行给出一个整数N(0<N<100)表示待测数据组数
使用动态规划,最主要的步骤是要分析出子问题及其重叠问题来。
对于此题,每一组字符串的长度 对于 寻找最长子序列的方法,并不会产生什么影响。例如长度为4、6与8、10的两组字符串,它们分别寻找最长子序列的方法并没有什么本质区别。正是因为这个原因,我们可以把N、M长度的字符串问题可以划分为N-1、M-1长度的问题,甚至还可以继续划分,这样实际上就产生了M+N个子问题(因为每次都是M或者N减去1而产生一个子问题),但是在这些子问题中,有很多重复地子问题,所以如果用递归解得话,会做很多重复地工作。更简单的方式是采用一个二维数组LCS[m][n]来记录所有可能的M、N取值组合下的最长公共子序列长度。
进一步分析,如何描述子问题?要分两种情况。
第一,如果str1[M]=str2[N]的情况下,最长公共子序列长度应该就是M-1、N-1长度的字符串组的最长公共子序列长度加上1。用公式表示就是LCS[M][N]=LCS[M-1][N-1]+1。
第二,如果str1[M]!=str2[N]的情况下,最长公共子序列长度应该在M-1、N 以及 M、N-1 这两个子问题之中最大公子序列长度的大者。用公式表示就是LCS[M][N]= MAX ( LCS[M-1][N] , LCS[M][N-1] )。
#include<stdio.h>
#include<string.h>
#include<iostream>
using namespace std;
int main()
{
int N,i,j;
scanf("%d",&N);
while(N--)
{
char str1[1001],str2[1001];
scanf("%s%s",str1,str2);
int len1=strlen(str1),len2=strlen(str2);
int LCS[len1+1][len2+1];
memset(LCS,0,sizeof(LCS));
for(i=1;i<=len1;i++)
{
for(j=1;j<=len2;j++)
{
if(str1[i-1]==str2[j-1])
LCS[i][j] = LCS[i-1][j-1] + 1;
else
LCS[i][j] = LCS[i][j-1]>LCS[i-1][j] ? LCS[i][j-1] : LCS[i-1][j];
}
}
printf("%d\n",LCS[len1][len2]);
}
}
对最长公共子序列的改进:
上面的做法只能够求出最长公共子序列的个数,那么如何输出最长公共子序列是那几个呢?
这里我们在循环中,加入一个数组变量b[i][j]来标记三种不同的搜索方向,再调用函数对其生成。