最长公共子序列python实现

最长公共子序列python实现

1、dp基本思路:

公共子序列最优子结构:
将问题分解表成更简单的子问题,这个子问题可以分解成更多的子问题使用动态规划算法求解,这个过程需要在一个表中储存同一级别的子问题的解,因此这个解可以被更高级的子问题使用。

2、问题的解

定义两个序列X、Y,二维数组f[i][j]表示X的i位和Y的j位之前的最长公共子序列长度,
则有
 f[1][1] = same(1,1)
 f[i][j] = max(f[i-1][j-1]+same(i,j),f[i-1][j],f[i][j-1)

其中same(i,j)表示X[i]==Y[j]
 same(a,b)当X的第a位于Y的第b位完全相同时为1,否则为0
 此时,f[i][j]中最大的数便是 X和 Y的最长公共子序列的长度,依据该数组回溯,便可找出最长公共子序列。

如:

X = 'helloword'
Y = 'eoskod'

X,Y的最长公共子序列长度为4,最长公共子序列为'eood'

该算法的空间、时间复杂度均为O(n^2)} O(n^2)。经过优化后,空间复杂度可为 O(n),时间复杂度可为O(nlogn)。
注:最长公共子序列不要求序列连续

python代码:

UP_LEFT = 0		#左上
UP = 1			#上
LEFT = 2		#左

def LCSlength(X,Y):
    '''
    输入:序列X和序列Y
    输出:X和Y的最长公共子序列长度
    '''
    #定义f数组,每行n个元素,每列m个元素
    m = len(X)
    n = len(Y)
    #lf = (lambda x,y:x+1 if x>y else y+1)
    #size = lf(m,n)
    f = [[0 for x in range(n+1)] for y in range(m+1)]
    #定义路径数组
    path = [[-1 for x in range(n+1)] for y in range(m+1)]

    for i in range(1,m+1):
        for j in range(1,n+1):
            if(X[i-1] == Y[j-1]):
               f[i][j] = f[i-1][j-1]+1
               path[i][j] = UP_LEFT
            else:
               #f[i][j] = max(f[i-1][j],f[i][j-1])
                if(f[i-1][j]>f[i][j-1]):
                    f[i][j] = f[i-1][j]
                    path[i][j] = UP
                else:
                    f[i][j] = f[i][j-1]
                    path[i][j] = LEFT
    return f[m][n],path

def getpath(path,X,i,j,arr):
    '''
        回溯求子序列
        输入:path,二维数组,路径信息
            X,原始序列
            i,j ,递归下标
            arr,存储结果元素
    '''
    if(i==0 or j ==0):
        return
    elif(path[i][j] == UP_LEFT):
        getpath(path,X,i-1,j-1,arr)
        arr.append(X[i-1])
    elif(path[i][j]==UP):
        getpath(path,X,i-1,j,arr)
    elif(path[i][j]==LEFT):
        getpath(path,X,i,j-1,arr)
    else:
        pass
        

X=[1,3,1,4,5]
Y=[1,1,1,4,5]

#X = 'helloword'
#Y = 'eoskod'
    
arr = []
length,path = LCSlength(X,Y)
getpath(path,X,len(X),len(Y),arr)
print(length)
print(arr)

看到网上还有将之转化成最长上升序列算法求解,思路是转化为最长上升子序列,并采用二分搜索,这种方法可以把平均时间复杂度降到nlogn,但是存在极端情况效率比普通的动态规划方法效率更低。先留个坑,后再研究,睡觉zzz

参考:

https://blog.csdn.net/v_JULY_v/article/details/6110269#commentsedit

https://zh.wikipedia.org/wiki/%E6%9C%80%E9%95%BF%E5%85%AC%E5%85%B1%E5%AD%90%E5%BA%8F%E5%88%97

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
最长公共子序列(Longest Common Subsequence,简称LCS)是指在两个序列中找到一个最长的子序列,使得该子序列两个序列中出现的顺序一致,但不要求连续。下面是一个用Python实现最长公共子序列的示例: ```python def longest_common_subsequence(seq1, seq2): m = len(seq1) n = len(seq2) # 创建一个二维数组来存储中间结果 dp = [[0] * (n+1) for _ in range(m+1)] # 填充二维数组,计算LCS的长度 for i in range(1, m+1): for j in range(1, n+1): if seq1[i-1] == seq2[j-1]: dp[i][j] = dp[i-1][j-1] + 1 else: dp[i][j] = max(dp[i-1][j], dp[i][j-1]) # 从二维数组中构建LCS lcs = [] i, j = m, n while i > 0 and j > 0: if seq1[i-1] == seq2[j-1]: lcs.append(seq1[i-1]) i -= 1 j -= 1 elif dp[i-1][j] > dp[i][j-1]: i -= 1 else: j -= 1 # 反转LCS得到最终结果 lcs.reverse() return lcs # 示例用法 seq1 = "ABCDGH" seq2 = "AEDFHR" lcs = longest_common_subsequence(seq1, seq2) print("Longest Common Subsequence:", "".join(lcs)) ``` 在这个示例中,我们定义了一个`longest_common_subsequence`函数,它接受两个序列`seq1`和`seq2`作为输入。函数使用动态规划的方法计算LCS的长度,并构建LCS序列。 在主程序中,我们使用示例输入序列`"ABCDGH"`和`"AEDFHR"`来测试`longest_common_subsequence`函数,并打印最长公共子序列。 运行上述代码,输出结果将是: ``` Longest Common Subsequence: ADH ``` 这表示序列`"ADH"`是`"ABCDGH"`和`"AEDFHR"`的最长公共子序列。 希望这个示例对你有帮助!如果你还有其他问题,请随时提问。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值