信息学奥赛一本通题目解析：1265：【例9.9】最长公共子序列

最新推荐文章于 2024-10-08 20:32:22 发布

信息学奥赛源老师

最新推荐文章于 2024-10-08 20:32:22 发布

阅读量673

点赞数 14

文章标签：算法数据结构

本文链接：https://blog.csdn.net/lan_in/article/details/136948293

版权

原题链接：1265：【例9.9】最长公共子序列

【题目描述】

一个给定序列的子序列是在该序列中删去若干元素后得到的序列。确切地说，若给定序列X=<x1,x2,…,xm>，则另一序列Z＝<z1，z2，…，zk>是X的子序列是指存在一个严格递增的下标序列<i1,i2,…,ik>,使得对于所有j=1,2,…,k有：

Xij=Zj

例如，序列Z=<B,C,D,B>是序列X=<A,B,C,B,D,A,B>的子序列,相应的递增下标序列为<2,3,5,7>。给定两个序列X和Y，当另一序列Z既是X的子序列又是Y的子序列时，称Z是序列X和Y的公共子序列。例如，若X＝<A,B,C,B,D,A,B>和Y＝<B,D,C,A,B,A>，则序列<B,C,A>是X和Y的一个公共子序列,序列 <B,C,B,A>也是X和Y的一个公共子序列。而且，后者是X和Y的一个最长公共子序列．因为X和Y没有长度大于4的公共子序列。

给定两个序列X＝<x1，x2，…，xm>和Y=<y1,y2…．yn>．要求找出X和Y的一个最长公共子序列。

【输入】

共有两行。每行为一个由大写字母构成的长度不超过1000的字符串，表示序列X和Y。

【输出】

第一行为一个非负整数。表示所求得的最长公共子序列的长度。若不存在公共子序列．则输出文件仅有一行输出一个整数0。

【输入样例】

ABCBDAB
BDCABA

【输出样例】

【提示】

最长公共子串（Longest Common Substirng）和最长公共子序列（Longest Common Subsequence，LCS）的区别为：子串是串的一个连续的部分，子序列则是从不改变序列的顺序，而从序列中去掉任意的元素而获得新的序列；也就是说，子串中字符的位置必须是连续的，子序列则可以不必连续。字符串长度小于等于1000。

【解题思路】

1. 确定状态的定义：

在LCS问题中，状态 dp[i][j] 被定义为字符串 a 的前 i 个字符和字符串 b 的前 j 个字符的最长公共子序列的长度。这个定义捕获了问题的本质——我们关注的是两个序列共有的部分的长度。

2. 确定状态的边界条件：

对于所有的 dp[0][j] 和 dp[i][0]，即一个字符串长度为0时，最长公共子序列长度自然为0，因为没有字符可比较。这些是动态规划表的边界条件。

3. 确定状态转移方程：

状态转移方程描述了如何从已知的状态转移到未知的状态。在LCS问题中，转移方程为：

如果 a[i - 1] == b[j - 1]，则 dp[i][j] = dp[i - 1][j - 1] + 1。相当于在两个较短序列的LCS基础上加1。
如果 a[i - 1] != b[j - 1]，则 dp[i][j] = max(dp[i - 1][j], dp[i][j - 1])。即不包含 a[i] 或 b[j] 时，两者之间的最长公共子序列的较大值。

4. 确定状态的计算顺序：

因为每个状态 dp[i][j] 依赖于 dp[i - 1][j]、dp[i][j - 1] 和 dp[i - 1][j - 1]，所以必须按照一定的顺序计算状态，通常是从小到大的顺序。这样可以确保计算 dp[i][j] 时，所依赖的状态已经被计算过。

5. 确定结果的位置：

在完成所有状态的计算后，根据问题的定义，结果通常位于动态规划表的某个特定位置。对于LCS，结果就是 dp[a.size()][b.size()]。

这个状态设计的思路不仅仅适用于LCS问题，而是动态规划问题的一般性设计方法。总结起来就是：

明确状态的物理含义。
设定边界状态的值。
根据问题特性，确定状态之间的转移关系。
计算状态时保持正确的顺序。
最后，从设置的状态中提取问题的答案。

#include <iostream> 
#include <string>   
#include <algorithm> // 包含算法库（用于max函数）
using namespace std; 

int dp[1005][1005]; // 声明一个动态规划表，用于存储子问题的解

int main() {
    string a, b; 
    cin >> a >> b; 

    // 外层循环，遍历字符串a的每一个字符
    for (int i = 1; i <= a.size(); i++) {
        // 内层循环，遍历字符串b的每一个字符
        for (int j = 1; j <= b.size(); j++) {
            // 如果当前字符相同，那么最长公共子序列长度在原有的基础上加一
            if (a[i - 1] == b[j - 1]) {
                dp[i][j] = dp[i - 1][j - 1] + 1;
            } else {
                // 如果当前字符不同，则取两种情况的较大值：
                // 1. 不考虑a的当前字符（即a的前i-1个字符和b的前j个字符的LCS）
                // 2. 不考虑b的当前字符（即a的前i个字符和b的前j-1个字符的LCS）
                dp[i][j] = max(dp[i - 1][j], dp[i][j - 1]);
            }
        }
    }
    
    // 输出结果：a和b的最长公共子序列的长度
    cout << dp[a.size()][b.size()] << endl;
    
    return 0; 
}