原题链接:1265:【例9.9】最长公共子序列
【题目描述】
一个给定序列的子序列是在该序列中删去若干元素后得到的序列。确切地说,若给定序列X=<x1,x2,…,xm>,则另一序列Z=<z1,z2,…,zk>是X的子序列是指存在一个严格递增的下标序列<i1,i2,…,ik>,使得对于所有j=1,2,…,k有:
Xij=Zj
例如,序列Z=<B,C,D,B>是序列X=<A,B,C,B,D,A,B>的子序列,相应的递增下标序列为<2,3,5,7>。给定两个序列X和Y,当另一序列Z既是X的子序列又是Y的子序列时,称Z是序列X和Y的公共子序列。例如,若X=<A,B,C,B,D,A,B>和Y=<B,D,C,A,B,A>,则序列<B,C,A>是X和Y的一个公共子序列,序列 <B,C,B,A>也是X和Y的一个公共子序列。而且,后者是X和Y的一个最长公共子序列.因为X和Y没有长度大于4的公共子序列。
给定两个序列X=<x1,x2,…,xm>和Y=<y1,y2….yn>.要求找出X和Y的一个最长公共子序列。
【输入】
共有两行。每行为一个由大写字母构成的长度不超过1000的字符串,表示序列X和Y。
【输出】
第一行为一个非负整数。表示所求得的最长公共子序列的长度。若不存在公共子序列.则输出文件仅有一行输出一个整数0。
【输入样例】
ABCBDAB
BDCABA
【输出样例】
4
【提示】
最长公共子串(Longest Common Substirng)和最长公共子序列(Longest Common Subsequence,LCS)的区别为:子串是串的一个连续的部分,子序列则是从不改变序列的顺序,而从序列中去掉任意的元素而获得新的序列;也就是说,子串中字符的位置必须是连续的,子序列则可以不必连续。字符串长度小于等于1000。
【解题思路】
1. 确定状态的定义:
在LCS问题中,状态 dp[i][j]
被定义为字符串 a
的前 i
个字符和字符串 b
的前 j
个字符的最长公共子序列的长度。这个定义捕获了问题的本质——我们关注的是两个序列共有的部分的长度。
2. 确定状态的边界条件:
对于所有的 dp[0][j]
和 dp[i][0]
,即一个字符串长度为0时,最长公共子序列长度自然为0,因为没有字符可比较。这些是动态规划表的边界条件。
3. 确定状态转移方程:
状态转移方程描述了如何从已知的状态转移到未知的状态。在LCS问题中,转移方程为:
- 如果
a[i - 1] == b[j - 1]
,则dp[i][j] = dp[i - 1][j - 1] + 1
。相当于在两个较短序列的LCS基础上加1。 - 如果
a[i - 1] != b[j - 1]
,则dp[i][j] = max(dp[i - 1][j], dp[i][j - 1])
。即不包含a[i]
或b[j]
时,两者之间的最长公共子序列的较大值。
4. 确定状态的计算顺序:
因为每个状态 dp[i][j]
依赖于 dp[i - 1][j]
、dp[i][j - 1]
和 dp[i - 1][j - 1]
,所以必须按照一定的顺序计算状态,通常是从小到大的顺序。这样可以确保计算 dp[i][j]
时,所依赖的状态已经被计算过。
5. 确定结果的位置:
在完成所有状态的计算后,根据问题的定义,结果通常位于动态规划表的某个特定位置。对于LCS,结果就是 dp[a.size()][b.size()]
。
这个状态设计的思路不仅仅适用于LCS问题,而是动态规划问题的一般性设计方法。总结起来就是:
- 明确状态的物理含义。
- 设定边界状态的值。
- 根据问题特性,确定状态之间的转移关系。
- 计算状态时保持正确的顺序。
- 最后,从设置的状态中提取问题的答案。
#include <iostream>
#include <string>
#include <algorithm> // 包含算法库(用于max函数)
using namespace std;
int dp[1005][1005]; // 声明一个动态规划表,用于存储子问题的解
int main() {
string a, b;
cin >> a >> b;
// 外层循环,遍历字符串a的每一个字符
for (int i = 1; i <= a.size(); i++) {
// 内层循环,遍历字符串b的每一个字符
for (int j = 1; j <= b.size(); j++) {
// 如果当前字符相同,那么最长公共子序列长度在原有的基础上加一
if (a[i - 1] == b[j - 1]) {
dp[i][j] = dp[i - 1][j - 1] + 1;
} else {
// 如果当前字符不同,则取两种情况的较大值:
// 1. 不考虑a的当前字符(即a的前i-1个字符和b的前j个字符的LCS)
// 2. 不考虑b的当前字符(即a的前i个字符和b的前j-1个字符的LCS)
dp[i][j] = max(dp[i - 1][j], dp[i][j - 1]);
}
}
}
// 输出结果:a和b的最长公共子序列的长度
cout << dp[a.size()][b.size()] << endl;
return 0;
}