DP最长子序列
题意
给出两个字符串,问最长公共子序列为多长(这里的公共子序列是只要求字符在字符串中出现的顺序,而不一定相邻)
建立最优值的递推式
-
不妨设两个子序列为
str1
和str2
,table[i][j]
表示公共子序列的长度,z[k]
为公共序列- 如果
str1[i] == str2[j]
,则table[i][j] = table[i-1][j-1] + 1
根据最优子结构原理,如果
z[k]
为str1[i] == str[j]
的最优子序列,那么z[k-1]
就是str1[i-1] == str[j-1]
的公共序列- 如果
str1[i] != str2[j]
, 则table[i][j] = max(table[i][j-1], table[i-1][j])
str1[i] != str2[j]
时,只需求解str1[i]
和str2[j-1]
或者str1[i-1]
和str2[j]
的公共序列,因而哪一个大就选择那个- 最长最序列的递归式
t a b l e [ i ] [ j ] = { 0 ( i = 0 o r j = 0 ) t a b l e [ i − 1 ] [ j − 1 ] + 1 ( s t r 1 [ i ] = = s t r [ j ] ) m a x ( t a b l e [ i ] [ j − 1 ] , t a b l e [ i − 1 ] [ j ] ) ( s t r 1 [ i ] ! = s t r 2 [ j ] ) table[i][j] = \begin{cases} 0 & (i=0 or j =0)\\ table[i-1][j-1] + 1 & (str1[i] == str[j])\\ max(table[i][j-1], table[i-1][j])&(str1[i] != str2[j]) \end{cases} table[i][j]=⎩⎪⎨⎪⎧0table[i−1][j−1]+1max(table[i][j−1],table[i−1][j])(i=0orj=0)(str1[i]==str[j])(str1[i]!=str2[j])
- 代码实现
for i in range(1, len(str1)): for j in range(1, len(str2)): if str1[i] == str2[j]: table[i][j] = table[i-1][j-1] + 1 else: table[i][j], trace[i][j] = mymax(table[i][j-1], table[i-1][j])
- 如果
算法设计
我们现在得到了最长子序列的长度,而不知道子序列是什么,但是我们通过观察上面的求解过程及递推
式不难发现,table[i][j]
有三个来源,我们可以通过记录这三个不同的来源就可以得到子序列。
# 用trace记录table[i][j]的三个不同来源
# 1左上角(table[i-1][j-1] + 1) trace[i][j] = 1
# 2左边(table[i][j-1] ) trace[i][j] = 2
# 3上面(table[i-1][j] ) trace[i][j] = 3
# 根据索引寻找subString即可
这样我们就可以根据trace[i][j]
来追踪子序列,当trace[i][j] = 1
时,记录str1[i]
(或者str2[j]
)即可。
完整代码
import numpy as np
def mymax(x, y):
"""
:param x:
:param y:
:return: 返回两者中的较大者,和路径来源
"""
if x >= y:
return x, 2
else:
return y, 3
def findSub(str1, trace, i, j):
"""
:param str1:
:param trace:
:param i:
:param j:
:return: 返回最长子串
"""
global sub
sub = ""
if i == 0 or j == 0:
return
if trace[i][j] == 1:
findSub(str1, trace, i-1, j-1)
sub += str1[i]
elif trace[i][j] == 2:
findSub(str1, trace, i, j-1)
else:
findSub(str1, trace, i-1, j)
if __name__ == '__main__':
a = input("str1:")
b = input("str2:")
str1 = list(a)
str1.insert(0, '0')
str2 = list(b)
str2.insert(0, '0') #用0占位
table = np.zeros((len(str1), len(str2)), dtype=int)
# 用trace记录table[i][j]的三个不同来源
# 1左上角, # 2左边, # 3上面
# 根据索引寻找subString即可
trace = np.zeros((len(str1), len(str2)), dtype=int)
for i in range(1, len(str1)):
for j in range(1, len(str2)):
if str1[i] == str2[j]:
table[i][j] = table[i-1][j-1] + 1
trace[i][j] = 1
else:
table[i][j], trace[i][j] = mymax(table[i][j-1], table[i-1][j])
findSub(str1, trace, len(str1)-1, len(str2)-1)
print(sub)
测试用例
str1 = "ABCADAB"
str2 = 'BACDAB"