#最长公共子序列,两个序列X和Y的公共子序列中,长度最长的那个。【不一定连续,区别于最长公共子串】
X长度为m,Y为n
LCS的记号:
Xi=<x1,...,xi>即X序列的前i个字符,字符串X的i前缀
Yj。。。。。
LCS(X,Y)为字符串X和Y的最长公共子序列,即Z=<z1,...,zk>
严格的说,LCS(X,Y)是个字符串集合【可能存在多个长度相同的最大子序列】
分析:
若Xm=Yn(最后一个字符相同),则:Xm与Yn的最长公共子序列Zk的最后一个字符必定为Xm(=Yn)
则LCS(Xm,Yn)=LCS(Xm-1,Yn-1)+Xm(Yn)
若Xm != Yn,则Xm与Yn的最长公共子序列Zk的最后一个字符,应当在LCS(Xm-1,Yn)或者LCS(Xm,Yn-1)中,则取LCS(Xm,Yn)=max{LCS(Xm-1,Yn),LCS(Xm,Yn-1)}
显然,属于动态规划问题
可用二维数组来记录最长公共子序列的长度
c[i][j],i=0或j=0表示空序列是Xi和Yj的最长公共子序列故c[i][j]=0
--- 0 i=0或j=0
c[i][j] --- c[i-1][j-1]+1 i>0,j>0,Xi=Yj
--- max{c[i][j-1],c[i-1][j]} i>0,j>0,Xi!=Yj
'''
def LCS(X,Y):
m=len(X)
n=len(Y)
c=[[0]*(n+1)]*(m+1)
direct=[[0]*(n+1)]*(m+1)
for i in range(m):
for j in range(n):
# if i==0 or j ==0:
# c[i][j]=0
if X[i]==Y[j]:
c[i+1][j+1]=c[i][j]+1
direct[i+1][j+1]='ok'
else:
if c[i+1][j]>c[i][j+1]:
c[i+1][j+1]=c[i+1][j]
direct[i+1][j+1]='left'
print('1111')
else:
c[i + 1][j + 1] = c[i][j+1]
return c,direct
def printLCS(direct,X,i,j):
if i==0 or j==0:
return
if direct[i][j]=='ok':
printLCS(direct,X,i-1,j-1)
print(X[i-1])
elif direct[i][j]=='up':
# print('up')
printLCS(direct,X,i-1,j)
else:
# print('left')
printLCS(direct,X,i,j-1)
# LCS2(direct, X, i, j)
X='ABCBDAB'
Y='BDCABA'
c,direct=LCS(X,Y)
printLCS(direct,X,len(X),len(Y))