【题目】
给定两个字符串str1和str2,返回两个字符串的最长公共子序列。
【举例】
str1 = “1A2C3D4B56”,str2 = “B1D23CA45B6A”.
“123456”或者“12C4B6”都是最长公共子序列,返回哪一个都行
【基本思路】
如果str1和str2的长度分别为N,M,生成N×M的矩阵dp,dp[i][j]的含义是str1[0…i]与str2[0…j]的最长公共子序列,dp[i][j]的计算如下:
矩阵的第一行表示str1[0]与str2[0…j]的最长公共子序列问题,当str1[0]与str2[j]相等时,其列以及之后的列都设置为1.
矩阵的第一列同上,当str2[0]与str1[i]相等时,其行以及之后的行都设置为1.
- 矩阵的其他位置,dp[i][j]的值可能来自以下的三种情况:
可能是dp[i-1][j], 代表str1[0…i-1]与str2[0…j]的最长公共子序列长度。
可能是dp[i][j-1], 代表str1[0…i]与str2[0…j-1]的最长公共子序列长度。
如果str1[i] == str2[j],还可能是dp[i-1][j-1] + 1。
选择三种情况中最大的作为dp[i][j]的值
接下来根据str1、str2和dp表就可以得到最长的公共子序列。具体方法如下:
从dp矩阵的右下角开始,如果该位置的值等于相邻左边的值,左移;如果该位置的值等于相邻上方的值,上移;如果既不能左移也不能上移,此处的值便是最长公共子序列的末尾值,保存此位置的值,然后向左上角移动。按照上述步骤依次移动便可以得到最长的公共子序列。
下面是使用python3.5实现的代码
#最长公共子序列问题
def maxCommonSubSerial(str1, str2):
def getdp(str1, str2):
dp = [[0 for i in range(len(str2))] for j in range(len(str1))]
dp[0][0] = 1 if str1[0] == str2[0] else 0
for i in range(1, len(str2)):
dp[0][i] = max(dp[0][i-1], 1 if str1[0] == str2[i] else 0)
for i in range(1, len(str1)):
dp[i][0] = max(dp[i-1][0], 1 if str1[i] == str2[0] else 0)
for i in range(1, len(str1)):
for j in range(1, len(str2)):
dp[i][j] = max(dp[i-1][j], dp[i][j-1])
if str1[i] == str2[j]:
dp[i][j] = max(dp[i-1][j-1]+1, dp[i][j])
return dp
if str1 == None or str2 == None or str1 == "" or str2 == "":
return ""
dp = getdp(str1, str2)
m = len(str2) - 1
n = len(str1) - 1
res = [0 for i in range(dp[n][m])]
index = dp[n][m] - 1
while index >= 0:
if n > 0 and dp[n][m] == dp[n-1][m]:
n -= 1
elif m > 0 and dp[n][m] == dp[n][m-1]:
m -= 1
else:
res[index] = str1[n]
index -= 1
m -= 1
n -= 1
return ''.join(res)