Python面试宝典第26题：最长公共子序列

希望_睿智

已于 2024-08-18 21:03:03 修改

阅读量997

点赞数 64

分类专栏： Python面试宝典文章标签： python 面试算法最长公共子序列递归法动态规划法

于 2024-08-03 11:33:40 首次发布

本文链接：https://blog.csdn.net/hope_wisdom/article/details/140880994

版权

Python面试宝典专栏收录该内容

46 篇文章 5 订阅

订阅专栏

题目

一个字符串的子序列是指这样一个新的字符串：它是由原字符串在不改变字符的相对顺序的情况下删除某些字符（也可以不删除任何字符）后组成的新字符串。比如："ace" 是 "abcde" 的子序列，但 "aec" 不是 "abcde" 的子序列。两个字符串的公共子序列是这两个字符串所共同拥有的子序列。

现给定两个字符串 text1 和 text2，返回这两个字符串的最长公共子序列的长度。如果不存在公共子序列，返回0。

备注：text1 和 text2 仅由小写英文字符组成。

示例 1：

输入：text1 = "abcde", text2 = "ace" 
输出：3  
解释：最长公共子序列是"ace" ，它的长度为3。

示例 2：

输入：text1 = "abc", text2 = "abc"
输出：3
解释：最长公共子序列是"abc"，它的长度为3。

示例 3：

输入：text1 = "abc", text2 = "def"
输出：0
解释：两个字符串没有公共子序列，返回0。

递归法

最长公共子序列，英文全称为Longest Common Subsequence，一般缩写为LCS。

递归法求解LCS的基本思想是：将大问题分解为小问题，通过比较两个字符串的末尾字符是否相等，来决定如何递归地解决问题。如果两个字符串的末尾字符相等，那么这个字符必定属于LCS的一部分。如果不相等，就需要分别去掉一个字符串的末尾字符，递归地求解子问题。使用递归法求解本题的主要步骤如下。

1、如果任意一个字符串为空，那么最长公共子序列的长度为0。

2、如果 text1 的最后一个字符和 text2 的最后一个字符相同，那么我们递归地求解 text1[:-1] 和 text2[:-1] 的LCS长度，并在结果上加1。

3、如果 text1 的最后一个字符和 text2 的最后一个字符不同，那么我们递归地求解 text1[:-1] 和 text2 的LCS长度，以及 text1 和 text2[:-1] 的LCS长度，取两者中较大的一个。

根据上面的算法步骤，我们可以得出下面的示例代码。

def lcs_by_recursion(text1, text2):
    def lcs_helper(t1, t2):
        if not t1 or not t2:
            return 0
        
        if t1[-1] == t2[-1]:
            # 末尾字符相同
            return lcs_helper(t1[:-1], t2[:-1]) + 1
        else: 
            # 末尾字符不同
            return max(lcs_helper(t1[:-1], t2), lcs_helper(t1, t2[:-1]))

    return lcs_helper(text1, text2)

print(lcs_by_recursion("abcde", "ace"))
print(lcs_by_recursion("abc", "abc"))
print(lcs_by_recursion("abc", "def"))

动态规划法

动态规划法通过构建一个二维数组来存储子问题的解，以避免重复计算。对于任意两个字符串的前缀，其最长公共子序列的长度取决于前一个字符是否相等：如果相等，则长度加1；如果不等，则取两者可能的最长公共子序列的最大值。使用动态规划法求解本题的主要步骤如下。

1、初始化。定义一个二维数组 dp，大小为 (len(text1) + 1) x (len(text2) + 1)。初始状态下，dp[0][j] = 0，dp[i][0] = 0。这是因为，空字符串与任何字符串的最长公共子序列长度都为0。

2、状态转移方程。遍历 text1 和 text2 的每个字符，对于 text1 中的第 i 个字符和 text2 中的第 j 个字符，进行以下操作。

（1）如果 text1[i-1] 等于 text2[j-1]，则 dp[i][j] = dp[i-1][j-1] + 1。

（2）如果 text1[i-1] 不等于 text2[j-1]，则 dp[i][j] = max(dp[i-1][j], dp[i][j-1])。

3、边界条件。当任一字符串为空时，最长公共子序列长度为0，这已经在初始化时处理。

4、获取结果。最终答案位于dp数组的右下角，即：dp[len(text1)][len(text2)]。

def lcs_by_dp(text1: str, text2: str) -> int:
    m, n = len(text1), len(text2)
    # 初始化DP表
    dp = [[0] * (n + 1) for _ in range(m + 1)]
    
    # 填充DP表
    for i in range(1, m + 1):
        for j in range(1, n + 1):
            if text1[i - 1] == text2[j - 1]:
                dp[i][j] = dp[i - 1][j - 1] + 1
            else:
                dp[i][j] = max(dp[i - 1][j], dp[i][j - 1])
    
    return dp[m][n]

print(lcs_by_dp("abcde", "ace"))
print(lcs_by_dp("abc", "abc"))
print(lcs_by_dp("abc", "def"))

总结

虽然递归法直观且易于理解，但它存在严重的重复计算问题，导致时间复杂度为指数级，效率极低。因此，在实际应用中，递归法通常被动态规划法所替代。动态规划法可以避免重复计算，将时间复杂度降低至O(m*n)，其中m和n分别是两个字符串的长度。

💡 需要《Python面试宝典》完整源码的大佬们，可订阅专栏后，搜索微信公众号“希望睿智”私信获取。

希望_睿智

关注

64
点赞
踩
37

收藏

觉得还不错? 一键收藏
打赏
28
评论
Python面试宝典第26题：最长公共子序列

一个字符串的子序列是指这样一个新的字符串：它是由原字符串在不改变字符的相对顺序的情况下删除某些字符（也可以不删除任何字符）后组成的新字符串。比如："ace" 是 "abcde" 的子序列，但 "aec" 不是 "abcde" 的子序列。两个字符串的公共子序列是这两个字符串所共同拥有的子序列。现给定两个字符串 text1 和 text2，返回这两个字符串的最长公共子序列的长度。如果不存在公共子序列，返回0。
复制链接

扫一扫