给定两个字符串 text1 和 text2,返回这两个字符串的最长 公共子序列 的长度。如果不存在 公共子序列 ,返回 0 。
一个字符串的 子序列 是指这样一个新的字符串:它是由原字符串在不改变字符的相对顺序的情况下删除某些字符(也可以不删除任何字符)后组成的新字符串。
例如,“ace” 是 “abcde” 的子序列,但 “aec” 不是 “abcde” 的子序列。
两个字符串的 公共子序列 是这两个字符串所共同拥有的子序列。
示例 1:
输入:text1 = “abcde”, text2 = “ace”
输出:3
解释:最长公共子序列是 “ace” ,它的长度为 3 。
示例 2:
输入:text1 = “abc”, text2 = “abc”
输出:3
解释:最长公共子序列是 “abc” ,它的长度为 3 。
示例 3:
输入:text1 = “abc”, text2 = “def”
输出:0
解释:两个字符串没有公共子序列,返回 0 。
提示:
1 <= text1.length, text2.length <= 1000
text1 和 text2 仅由小写英文字符组成。
这题是最长公共子序列问题,也被称为 LCS (Longest Common Subsequence)问题,可以使用动态规划来做。
状态定义:dp[i][j] 表示 text1 在 [0, i-1] 范围内的序列和 text2 在 [0, j-1] 范围内的序列的 LCS;子序列的边界分别为i-1和j-1
状态转移:
如果边界点上相等,即 text1[i-1]==text2[j-1],那么说明我们找到了公共子序列中的一个字符,则 dp[i][j] = dp[i-1][j-1] + 1;
否则 dp[i][j] = max(dp[i-1][j], dp[i][j-1]);
边界条件:dp[0][.] 或dp[.][0]代表两个字符串有一个为空,则 LCS 的长度就为 0,也就是 dp[0][.] = dp[.][0] = 0;
class Solution(object):
def longestCommonSubsequence(self, text1, text2):
"""
:type text1: str
:type text2: str
:rtype: int
"""
dp = [[0]*(len(text2)+1) for _ in range(len(text1)+1)]
for i in range(1, len(text1)+1):
for j in range(1, len(text2)+1):
# dp[0][*]和dp[*][0]是哨兵位置,代表了其中一个字符串为空
# 匹配上了
# 当 i-1或者j-1为0,则LCS为1,由于哨兵初始为0,因此在初始值上直接+1
if text1[i-1] == text2[j-1]:
dp[i][j] = dp[i-1][j-1] + 1
# 没匹配上
# 当i-1和j-1都为0,则LCS为0,由于哨兵初始为0,因此下式子也为0
# 当i-1和j-1只有一个为0,则用下面的推导公式
# 当i-1和j-1全部都不为0,则用下面的推导公式
else:
dp[i][j] = max(dp[i-1][j], dp[i][j-1])
return dp[-1][-1]