1. 题目来源
链接:最长公共子序列
来源:牛客网
2. 题目说明
我们有两个字符串m和n,如果它们的子串a和b内容相同,则称a和b是m和n的公共子序列。子串中的字符不一定在原字符串中连续。
例如字符串“abcfbc”和“abfcab”,其中“abc”同时出现在两个字符串中,因此“abc”是它们的公共子序列。此外,“ab”、“af”等都是它们的字串。
现在给你两个任意字符串(不包含空格),请帮忙计算它们的最长公共子序列的长度。
输入描述:
输入包含多组数据。
每组数据包含两个字符串m和n,它们仅包含字母,并且长度不超过1024。
输出描述:
对应每组输入,输出最长公共子序列的长度。
示例:
输入
abcfbc abfcab
programming contest
abcd mnp
输出
4
2
0
3. 题目解析
题目要求比较简单:获取两个字符串的最长公共的子序列,注意:子序列即两个字符串中公共的字符,但不一定连续。动态规划求解最长公共子序列(LCS): 对于母串X=<x1,x2,⋯,xm>, Y=<y1,y2,⋯,yn>,求LCS。
假设:假设Z=<z1,z2,⋯,zk>是X与Y的LCS, 我们观察到:
1. 如果xm=yn,则zk=xm=yn,有Zk−1是Xm−1与Yn−1的LCS
2. 如果xm≠yn,则Zk是Xm与Yn−1的LCS,或者是Xm−1与Yn的LCS
因此,求解LCS的问题则变成递归求解的两个子问题。但是,上述的递归求解的办法中,重复的子问题多,效率低下。改进的办法——用空间换时间,用数组保存中间状态,方便后面的计算。这就是动态规划(DP)的核心思想了。用二维数组dp[i,j]记录串x1x2⋯xi与y1y2⋯yj的LCS长度,则可得到状态转移方程:
1. dp[i,j]=0 i=0 or j=0
2. dp[i,j]= dp[i−1,j−1]+1 i,j>0 and xi=yj
3. dp[i,j]=max(dp[i,j−1], dp[i−1,j]) i,j>0 and xi≠yj
4. 代码展示
// write your code here cpp
#include <bits/stdc++.h>
using namespace std;
int main() {
string s1, s2;
while (cin >> s1 >> s2) {
int s1Length = s1.length();
int s2Length = s2.length();
// 用来保存状态转移方程中间结果的矩阵
vector<vector<int>> dp(s1Length, vector<int>(s2Length, 0));
// 初始化dp矩阵边界:边界要么在,要么不在
dp[0][0] = (s1[0] == s2[0]) ? 1 : 0;
for (int i = 1; i < s1Length; ++i) {
dp[i][0] = (s1[i] == s2[0]) ? 1 : 0;
dp[i][0] = max(dp[i - 1][0], dp[i][0]);
}
for (int j = 1; j < s2Length; ++j) {
dp[0][j] = (s1[0] == s2[j]) ? 1 : 0;
dp[0][j] = max(dp[0][j - 1], dp[0][j]);
}
// 根据状态转移方程进行计算
for (int i = 1; i < s1Length; ++i) {
for (int j = 1; j < s2Length; ++j) {
dp[i][j] = max(dp[i - 1][j], dp[i][j - 1]);
if (s1[i] == s2[j])
dp[i][j] = max(dp[i][j], dp[i - 1][j - 1] + 1);
}
}
cout << dp[s1Length - 1][s2Length - 1] << endl;
}
return 0;
}