题目
给定两个字符串str1和str2,返回两个字符串的最长公共子序列。
举例
str1 = “1A2C3D4B56”,str2 = “B1D23CA45B6A”.
“123456”或者“12C4B6”都是最长公共子序列,返回哪一个都行
基本思路
如果str1和str2的长度分别为N,M,生成N×M的矩阵dp,dp[i][j]的含义是str1[0…i]与str2[0…j]的最长公共子序列,dp[i][j]的计算如下:
矩阵的第一行表示str1[0]与str2[0…j]的最长公共子序列问题,当str1[0]与str2[j]相等时,其列以及之后的列都设置为1.
矩阵的第一列同上,当str2[0]与str1[i]相等时,其行以及之后的行都设置为1.
矩阵的其他位置,dp[i][j]的值可能来自以下的三种情况:
(1)可能是dp[i-1][j], 代表str1[0…i-1]与str2[0…j]的最长公共子序列长度。
(2)可能是dp[i][j-1], 代表str1[0…i]与str2[0…j-1]的最长公共子序列长度。
(3)如果str1[i] == str2[j],还可能是dp[i-1][j-1] + 1。
选择三种情况中最大的作为dp[i][j]的值,接下来根据str1、str2和dp表就可以得到最长的公共子序列。具体方法如下:
从dp矩阵的右下角开始,如果该位置的值等于相邻左边的值,左移;如果该位置的值等于相邻上方的值,上移;如果既不能左移也不能上移,此处的值便是最长公共子序列的末尾值,保存此位置的值,然后向左上角移动。按照上述步骤依次移动便可以得到最长的公共子序列
def lcse(str1,str2):
if str1 == None or str2 == None or str1 == '' or str2=='':
return None
dp = getdp(str1,str2)
m = len(str1)-1
n = len(str2)-1
res = [[0 for i in range(n)] for j in range(m)]
index = dp[m][n]-1
while index>0:
if m >0 and dp[m][n] == dp[m-1][n]:
m-=1
elif n>0 and dp[m][n] == dp[m][n-1]:
n-=1
else:
res[index] = str1[m]
index -= 1
m -=1
n -=1
return ''.join(res)
def getdp(str1,str2):
dp = [[for i in range(len(str2))] for j in range(len(str1))]
dp[0][0] = 1 if str1[0]==str2[0] else 0
for i in range(1,len(str1)):
dp[i][0] = max(dp[i-1][0],1 if str1[i] == str2[0] else 0)
for j in range(1,len(str2)):
dp[0][j] = max(dp[0][j-1],1 if str2[j] == str1[0] else 0)
for i in range(1,len(str1)):
for j in range(1,len(str2)):
dp[i][j] = max(dp[i-1][j],dp[i][j-1])
if str1[i] == str2[j]:
dp[i][j] = dp[i-1][j-1] + 1
return dp
str1 = "1A2C3D4B56"
str2 = "B1D23CA45B6A"
lcse(str1,str2)