动态规划(DP)---LCS(the Longest Common Subsequence)

最新推荐文章于 2020-10-08 17:57:19 发布

gang_conquer

最新推荐文章于 2020-10-08 17:57:19 发布

阅读量910

点赞数 1

分类专栏：算法与数据结构文章标签：动态规划-LCS

本文链接：https://blog.csdn.net/bribo/article/details/44587999

版权

算法与数据结构专栏收录该内容

4 篇文章 0 订阅

订阅专栏

0 暴力求解两个序列的最长公共子序列(LCS)

$string \quad x$ : B D C A B A
$string \quad y$ : A B C B D A B

字符串 $x\quad y$ 的几个最长公共子序列是这个样子的:

B D A B B C B A B C A B

$BDAB \quad BCBA\quad BCAB$

第一次遇到这种题时，我会不假思索地将字符串 $x \quad y$ 所有的子序列找出来，然后一个个地比较来找出它们的最长子序列（LCS）。那么问题来了，一个长度为 $m$ 的字符串到底有多少个子序列呢？

含 1 个 字 符 的 子 串 有 C 1 m 个 子 串

$含\quad 1 \quad个字符的子串有 \quad C_m^1 \quad个子串$

含 2 个 字 符 的 子 串 有 C 2 m 个 子 串

$含\quad 2 \quad个字符的子串有 \quad C_m^2 \quad个子串$

含 3 个 字 符 的 子 串 有 C 3 m 个 子 串

$含\quad 3 \quad个字符的子串有 \quad C_m^3 \quad个子串$

. . . . .

$.....$

含 m 个 字 符 的 子 串 有 C m m 个 子 串

$含\quad m \quad个字符的子串有 \quad C_m^m \quad个子串$

子序列的个数为: $C_m^1 + C_m^2+C_m^3+...+C_m^m$

这个跟二项展开式很像，二项展开式是这个样子的：

(a + b) m = C 0 m a m + C 1 m a m - 1 b 1 + C 2 m a m - 2 b 2 + . . . + C r m a m - r b r + . . . + C m m b m

$(a+b)^m = C_m^0a^m + C_m^1a^{m-1}b^1+C_m^2a^{m-2}b^2+...+C_m^ra^{m-r}b^r+...+C_m^mb^m$

所以，一个长度为 $m$ 的字符串一共有 $2^m-1$ 个子序列。

那么，使用暴力的方式，找出两个长度分别为 $m, n$ 的字符串的 LCS 的时间复杂度是多少呢？

$1 s t, 找出两个字符串的所有子序列 : = > 2 m - 1 + 2 n - 1 = Θ (2 m + 2 n)$ $1st,\quad 找出两个字符串的所有子序列:\quad=>\quad 2^m-1+2^n-1=\Theta(2^m+2^n)$
$2 n d, 将各自的所有子序列两两比较 : = > (2 m - 1) \times (2 n - 1) = Θ (2 m + n)$ $2nd, \quad 将各自的所有子序列两两比较:\quad=>\quad (2^m-1)\times(2^n-1) = \Theta(2^{m+n})$
由此，暴力破解的时间复杂度就是： $Θ (2 m + 2 n) + Θ (2 m + n) = Θ (2 m + n)$ $\Theta(2^m+2^n)+\Theta(2^{m+n})=\Theta(2^{m+n})$
如何？暴力破解所消耗的时间是 指数规模（exponential time）的，这样的速度就是龟速！

1 动态规划（Dynamic Programming）

动态规划通常用来求解最优化问题（optimization problem）。这类问题可以有很多可行解，每个解都有一个值，我们希望寻找具有最优值（最小值或最大值）的解。我们称这样的解为问题的一个最优解（an optimal solution），而不是最优解（the optimal solution)，因为可能有多个解达到最优值。

我们通常按如下4个步骤来设计一个动态规划算法：

1，刻画一个最优解的结构特征。
2，递归地定义最优解的值。
3，计算最优解的值，通常采用自底向上的方法。
4，利用计算出的信息构造一个最优解。

————自《算法导论》机械工业出版社

并不是所有的最优问题都可以使用动态规划来求解，使用动态规划必须满足两个问题：

1. 最优子问题（optimal subproblems）。
2. 重叠子问题（overlapping subproblems）。

2 使用动态规划求解LCS

按照上面提到的4个步骤来设计一个求解LCS的动态规划算法。

2.1 刻画一个最优解的结构特征

定义：
$c [i, j] = | L C S (x [1... i], y [1... j]) | . . . . . . (1)$ $c[i,j] = |LCS(x[1...i],\quad y[1...j])|\quad \quad......(1)$
$c[i,j]$ 为字符串 $x[1...i]$ 和 $y[1...j]$ 的 LCS 的长度。

那么：
$c [m, n] = | L C S (x, y) | m, n 为字符串 x, y 的长度$ $c[m,n] = |LCS(x,\quad y)|\quad m,n\quad 为字符串\quad x,y\quad的长度$
因此，LCS 最优解的结构特征就是 $c[m,n]$ 。

2.2 递归定义最优解的值

根据2.1定义的最优解的结构特征，写出 $c[i,j]$ 的归纳表达式如下：

$c [i, j] = {c [i - 1, j - 1] + 1 m a x {c [i - 1, j], c [i, j - 1]} i f x [i] = = y [j] o t h e r w i s e} . . . . . . (2)$ $c[i,j]= \begin{Bmatrix} c[i-1,j-1]+1 & if\quad x[i]==y[j]\\ max\{c[i-1,j], \quad c[i,j-1]\} & otherwise \end{Bmatrix}\quad \quad......(2)$
下面证明式(2)的正确性。

$if\quad x[i]==y[j]$

$令 z [1... k] 等于 L C S (x [1... i], y [1... j]) ，那么 c [i, j] = k 且 z [k] = x [i] = y [j]$ $令\quad z[1...k]\quad 等于\quad LCS(x[1...i],y[1...j])，那么\quad c[i,j]=k\quad且\quad z[k]=x[i]=y[j]$
$z [1... k - 1] = L C S (x [1... i - 1], y [1... j - 1]) c [i - 1, j - 1] = k - 1$ $z[1...k-1] = LCS(x[1...i-1],y[1...j-1])\quad c[i-1,j-1]=k-1$
$假设存在一个公共子序列 w = C S (x [1... i - 1], y [1... j - 1]), 其长度 | w | > k - 1 ，使用 w 后接 z [k] 组成一个新序列，则新序列的长度 c [i, j] = | w, z [k] | > k ，这与之前的 c [i, j] = k 相矛盾！这种证明方法就是 C u t C o p y 方法$ $假设存在一个公共子序列\quad w=CS(x[1...i-1],y[1...j-1]),\quad 其长度\quad |w|>k-1，使用w后接z[k]组成一个新序列，则新序列的长度\quad c[i,j]=|w,z[k]|>k，这与之前的\quad c[i,j]=k\quad 相矛盾！这种证明方法就是 Cut Copy方法$

$other\quad x[i]!=y[j]$ 证明略。

2.3 计算最优解的值，通常采用自底向上

2.3.1 自顶向下

参照归纳表达式(2)，写出LCS递归算法如下：

LCS(x,y,i,j) if x[i] == x[j] c[i,j]=LCS(x,y,i-1,j-1)+1 else c[i,j]=max(LCS(x,y,i-1,j),LCS(x,y,i,j-1)) return c[i,j]

在最坏情况下，即 $x[i]!=y[j]$ ，参数 $string \quad x, \quad y$ 的部分递归树，如下：

递归树的高度为： $m+n=13\quad$ m,n为两个字符串的长度。根据满二叉树的性质，知道高度 $h$ ，就可以算出二叉树节点的总数为 $2^h-1$ ，从上面的递归树可以知道，一个节点就是一个子问题，那么算法的时间复杂度有一个渐进紧确上界为： $O(2^{m+n})$ 。

由蓝色虚线框出的部分可以看出，递归算法存在重复运算，这也验证了动态规划的第二个特征：重叠子问题。
改进算法，将子问题的解存储起来（备忘法），下次求解相同子问题时直接取出解：

LCS(x,y,i,j) if c[i,j]!=nil return c[i,j] if x[i] == x[j] c[i,j]=LCS(x,y,i-1,j-1)+1 else c[i,j]=max(LCS(x,y,i-1,j),LCS(x,y,i,j-1)) return c[i,j]

使用备忘法后，独立子问题的规模就只有 $m\times n$ ，相应的时间复杂度为 $\Theta(m\times n)。$
那么，独立子问题的规模是怎么知道的呢？答案就在算法中的数组 $c[i,j]$ ，整个算法就是在填充二维数组 $c$ ，所以独立子问题的规模就等于二维数组 $c$ 的大小 $m\times n$ 。

2.3.2 自底向上(bottom-up)

从前面的自顶向下可以看出，算法有很多的重复计算，虽然采用备忘法可以去掉重复，但是程序极为不清晰。一般来说，真正的动态规划更多的是采用自底向上的方法来去重复。

参照式（2）归纳式，可以很容易地写出自底向上的伪代码，其求解方法就是自底向上填充数组 $c$ ：

LCS（x,y,m,n) for i=0 to m-1 for j=0 to n-1 if x[i]=y[j] c[i,j]=c[i-1,j-1]+1 else c[i,j]=max(c[i-1,j],c[i,j-1]) return c[m,n] //代码没有考虑 c[-1,-1]，由于 c[-1,-1]没有任何前缀字符，所以 c[-1,-1]=0, c[-1,*]=c[*,-1]=0

根据代码来填充数组 $c$ ，如下图所示：

如图所示，蓝色边框就是计算后的数组 $c$ ，在 $c$ 中，红色元素为上面代码中满足 $x[i]=y[j]$ 的情形，蓝色情况为不满足情形。

2.4 利用计算出的信息构造一个最优解

那么利用数组 c <script type="math/tex" id="MathJax-Element-50">c</script> 的信息如何找出真正满足LCS的条件呢？

确定要放弃本次机会？
福利倒计时
: :

立减 ¥
普通VIP年卡可用
立即使用

gang_conquer

关注关注

1
点赞

踩

0

收藏

觉得还不错? 一键收藏

0
评论

动态规划(DP)---LCS(the Longest Common Subsequence)

动态规划-LCS
复制链接

扫一扫

专栏目录

最长公共子序列LCS（The longest common subsequence）

Linnnnnger的博客

05-07 831

最长公共子序列，英文缩写为LCS（Longest Common Subsequence）。其定义是，一个序列 S ，如果分别是两个或多个已知序列的子序列，且是所有符合此条件序列中最长的，则 S 称为已知序列的最长公共子序列。而最长公共子串(要求连续)和最长公共子序列是不同的. 最长公共子序列是一个十分实用的问题，它可以描述两段文字之间的“相似度”，即它们的雷同程度，从而能够用来辨别抄袭。对一段文

最长公共子序列 (LCS,longest common subsequence problem) 动态规划

周健华的专栏

07-24 1032

/* 函数:最长公共子序列 (LCS,longest common subsequence problem) 动态规划解决该问题. 算法见算法导论原书第三版殷建平 P224一个给定的子序列就是将给定的一个或多个元素去掉之后的结果. 最长公共子序列,求x,y长度最长的公共子序列.x={x1,x2...xm} y={y1,y2...yn} 分情况: 1.当xm=yn时,应该求解x(m-

参与评论您还未登录，请先登录后发表或查看评论

LCS（Longest Common Subsequence 最长公共子序列）

wangjun_huster的博客

03-26 1598

一、基本定义LCS是Longest Common Subsequence的缩写，即最长公共子序列。一个序列，如果是两个和多个已知序列的子序列，且是所有子序列中最长的，则为最长公共子序列。子串！= 子序列子串：是连续在一起的；子序列：子序列中的字符在字符串中不一定连续，但是子序列一定是单调的（即字符之间ASCII单调递增或单调递减）一个序列S任意删除若干个字符得到新序列T，则T

Geeks面试题： Longest Common Subsequence (LCS)

架构设计

01-01 120

Longest Common Subsequence We have discussed Overlapping Subproblems and Optimal Substructure properties inSet 1andSet 2respectively.We also discussed one example problem inSet 3.Let ...

LCS(Longest Common Subsequence)算法

一些杂乱的记录

03-02 654

LCS：最长公共子序列。例：A{a,d,h,e,g,s,l} B{y,a,r,e,s,d} LCS< A,B >={a,e,s}思路：设A{a1,a2,…,an} B{b1,b2,…,bm} 若an==bm;则LCS< A,B >=LCS< A(n-1),B(m-1) >+an/bm 若an!=bm;则LCS< A,B >=L

01-F-8 理解LCS & 01-F-9 LCS动态规划1

08-03

**最长公共子序列 (Longest Common Subsequence, LCS)** 是两个序列中，不考虑子序列元素的相对位置，最长的、共有的子序列。LCS 不仅在计算机科学中广泛应用，比如在比较文本、生物信息学等领域，而且是动态规划的...

The_longest_common_sub-string.rar_The Common

09-14

总结来说，"The Longest Common Sub-string"问题是一个典型的字符串处理问题，可以通过动态规划方法高效地解决。在实际应用中，这种问题解决技巧对于处理大量文本数据或寻找相似性具有重要意义。通过理解并掌握这一...

lcs.rar_LCS_动态规划

09-22

最长公共子序列（Longest Common Subsequence, LCS）是计算机科学中一种经典的字符串问题，它在算法导论中占有重要地位。LCS问题的目标是找到两个给定序列（通常是字符串）的最长子序列，这个子序列不必连续，但必须...

most-common-subsequence-string.rar_数据结构_Visual_C++_

08-12

本项目聚焦于一个经典问题——计算两个字符串的最大公共子序列（Longest Common Subsequence，LCS）。这是一个在序列比对、文本编辑距离等领域有广泛应用的问题。本压缩包中的源码提供了使用动态规划方法解决这一...

LCS.rar_动态规划

09-19

在IT领域，动态规划是一种强大的算法，用于解决各种复杂问题，包括寻找两个序列中的最长公共子序列（Longest Common Subsequence, LCS）。本压缩包"**LCS.rar_动态规划**"显然关注的是如何利用动态规划来处理这个...

Longest Common Subsequence递归及动态规划python实现

zhongbing1234的博客

10-08 384

Longest Common Subsequence 从两个字符串中找到公共的最长子串：例如：text1 = “abcad” test2 = “acd” 最长公共子串为acd，放回3 如果直接使用暴力求解，效率低，同时问题会比较复杂，要考虑很多情况，比如，“abdac” 和"acd"，此时的最长子串为ac或者ad，放回为2，这里的子串是有一定的顺序的。而不能直接用两个for循环，依次比较每个位置的字符就能解决的。这种求法需要把所有的情况包括进行，比较复杂。第二种方法是递归法，只需要考虑一个最小问题即可。

LCS算法的概述及由来（LCS）最长公共子序列

bokzmm的博客

08-10 1047

第一节、问题描述什么是最长公共子序列呢?好比一个数列 S，如果分别是两个或多个已知数列的子序列，且是所有符合此条件序列中最长的，则S 称为已知序列的最长公共子序列。举个例子，如：有两条随机序列，如 1 3 4 5 5 ，and 2 4 5 5 7 6，则它们的最长公共子序列便是：4 5 5。注意最长公共子串（Longest CommonSubst

LCS (Longest Common Subsequence)

我是一只程序⚪的技术交流平台

02-20 395

一、最长公共子序列一个数列 S，如果分别是两个或多个已知数列的子序列，且是所有符合此条件序列中最长的，则S称为已知序列的最长公共子序列。最长公共子串（Longest CommonSubstring）和最长公共子序列（LongestCommon Subsequence,LCS）的区别：子串是串的一个连续的部分，子序列则是从不改变序列的顺序，而从序列中去掉任意的元素而获得的新序列；更简略地说，子串...

Longest common subsequence

bachelorchen的专栏

05-18 1805

https://www.ics.uci.edu/~eppstein/161/960229.html ICS 161: Design and Analysis of Algorithms Lecture notes for February 29, 1996 Longest Common Subsequences In this lecture we examine

uva 10405 - Longest Common Subsequence(LCS)

不慌不忙、不急不躁

09-03 1040

题目连接：10405 - Longest Common Subsequence 题目大意：求两个字符串的最长公共子序列。解题思路：套公式。 #include #include const int N = 1005; int max(const int& a, const int& b) { return a > b ? a : b; } char a[N],

动态规划 (Dynamic Programming) 之最长公共子序列(Longest Common Subsequence)

热门推荐

斯巴达的勇士已经是雅典的臣民了。。。

03-02 1万+

这个问题也是算法导论上提过的问题。注意这个问题是Subsequence不是Substring。substring的话就是子串，子串的要求的连续相等的字符序列，而subsequence不要求连续。比如说ABCD和ABD。他们的longest common subsequence就是ABD。而Longest common substring就是AB。这个问题和Edit Distance是同样的一类

ssm_078_mysql_高校就业管理系统_.zip

08-09

基于SSM框架及MySQL数据库实现的就业管理系统的设计和开发过程。本论文中所讲的就业管理系统是通过所学的知识创办一个非商业性的网站平台，使所有想要就业信息查看的高校毕业生们与想要宣传自己公司的商家们都可以更方便快捷的进行就业和体验。在现实生活中，如果商家想宣传自己的公司，或者毕业季的大学生们想要就业找工作之前做攻略都需要很高的时间成本。对招聘的公司来说，经常会出现公司缺人但岗位无人问津的情况，一定程度上影响了公司的运营与发展。此网站开发出来之后不管是对所有想要了解就业岗位的学生还是宣传自己公司的商家来说，都节省了时间成本、宣传成本。SSM高校就业管理系统系统提供了丰富的功能，用户可以直接在系统上面获取岗位或公司的信息，如公司图片、岗位名称、岗位信息等，网站的用户可以在网站上直接与管理员进行在线沟通。与传统的就业平台相比，本系统能够提供更及时的服务，大大节省时间成本。

【创新发文无忧】Matlab实现鸽群优化算法PIO-DELM的故障诊断算法研究.rar

08-09

1.版本：matlab2014/2019a/2024a 2.附赠案例数据可直接运行matlab程序。 3.代码特点：参数化编程、参数可方便更改、代码编程思路清晰、注释明细。 4.适用对象：计算机，电子信息工程、数学等专业的大学生课程设计、期末大作业和毕业设计。 5.作者介绍：某大厂资深算法工程师，从事Matlab算法仿真工作10年；擅长智能优化算法、神经网络预测、信号处理、元胞自动机等多种领域的算法仿真实验，更多仿真源码、数据集定制私信+。替换数据可以直接使用，注释清楚，适合新手

基于Springboot的动物领养平台设计与开发 Javaee项目，springboot项目

最新发布

08-09

资源详情：https://blog.csdn.net/2302_78191516/article/details/141071581

动态规划--最长公共子序列问题

04-02

最长公共子序列问题（Longest Common Subsequence，简称LCS）是指在两个序列中找到一个最长的公共子序列，其中一个序列的所有元素按原序列中出现的顺序排列，而另一个序列中的元素则不要求按原序列中出现的顺序排列。 动态规划方法可以很好地解决LCS问题。设A和B是两个序列，LCS(A,B)表示A和B的最长公共子序列。则可以设计如下的状态转移方程：当A和B的末尾元素相同时，LCS(A,B) = LCS(A-1,B-1) + 1。当A和B的末尾元素不同时，LCS(A,B) = max(LCS(A-1,B), LCS(A,B-1))。其中，LCS(A-1,B-1)表示A和B的末尾元素相同时的情况，LCS(A-1,B)表示A的最后一个元素不在最长公共子序列中，而B中的最后一个元素在最长公共子序列中的情况，LCS(A,B-1)表示B的最后一个元素不在最长公共子序列中，而A中的最后一个元素在最长公共子序列中的情况。根据这个状态转移方程，可以使用动态规划算法来求解LCS问题。具体方法是，构建一个二维数组dp，其中dp[i][j]表示A前i个元素和B前j个元素的LCS。初始化dp[0][j]和dp[i][0]为0，然后按照上述状态转移方程进行递推，最终得到dp[lenA][lenB]，其中lenA和lenB分别表示A和B的长度。dp[lenA][lenB]即为A和B的最长公共子序列的长度。要找到具体的最长公共子序列，可以从dp[lenA][lenB]开始，按照状态转移方程反向推导出每个元素，即可得到最长公共子序列。 LCS问题是动态规划算法的经典应用之一，时间复杂度为O(n*m)，其中n和m分别为A和B的长度。