Longest common subsequence problem (最长公共字串)

题目描述:

如果字符串一的所有字符按其在字符串中的顺序出现在另外一个字符串二中,则字符串一称之为字符串二的子串。注意,并不要求子串(字符串一)的字符必须连续出现在字符串二中。请编写一个函数,输入两个字符串,求它们的最长公共子序列,并打印出最长公共子序列。


例如:输入两个字符串BDCABA和ABCBDAB,字符串BCBA和BDAB都是是它们的最长公共子序列,则输出它们的长度4。

EXAMPLE INPUT

BDCABA
ABCBDAB

EXAMPLE OUTPUT
4


解题思路:

有几种思考方向:

设较长的字符串为A,较短的字符串为B。

第一种,保持A动,让B动起来,把B的字符一个个在A上遍历,如果有,返回真,没有,返回假。

这时候问题来了:

假设B的第一个字符在A中找到了,B中第二个字符在A中也找到了,我们需要判断它们在A中的位置关系是否与B中一样;

判断完之后,继续判断B中第三个字符,如不存在,这时候,不能马上把这个字符抹去,得保留,因为我们不知道以这个字符为起点的另外一个字符串是不是满足条件的最长公共子串。

这样就有两个自序列必须保留,以此类推,可以预见的是

当B足够长的话,我们必须建立足够多的子字符串来表示这些零碎的子字符串,最后取它们中长度最大的那一个。

事实上,这实现起来相当困难。

那就换一种思路。


动态规划。

证明两个:

1.最优解原理

2.后无效性原则

设两个字符串分别为A,B(没有长短之分)

设LCS(i,j) 表示  

A的前i个字符组成的字符串  与

B的前j个字符组成的字符串 的

最长公共子串的长度。

是不是看得头晕眼花?那就多看几遍知道看明白。

对与A[i] 与 B[j],这里表示的是A的第i+1个字符,B的第 j+1个字符.因为下标是从零开始的。

此时,如果A[i]==B[j],则此时,我们可以把A[i] 与 B[j]抹去,计算LCS(i-1,j-1);

而且,LCS(i,j)=LCS(i-1,j-1)+1;

在这里,为什么上式一定是正确的?

反证法:

那么假设有某条途径LIS(i-1,j-1)到达LCS(i,j)的值比LCS(i-1,j-1)的值要大,

这是荒谬的,因为假如在i,j,之前有另一个值

LIS(i-1,j-1)虽然不是最优解,但是,它通过A[i]和B[j]这两个长度的字符串的比较操作,使得它成为最优解,

那么事实上,它后来包含的字符一定包含在LCS(i-1,j-1)里面,因为LIS(i-1,j-1)与LCS(i-1,j-1)它们的b包含的A,B序列相同。

所以满足了最优子结构特征。

符合动态规划。

再来看

若A[i]!=B[j]的情况。

那么只考虑max(LCS(i-1,j),LCS(i,j-1));

分析方法同上

那么,终止条件是什么?

注意到i>0,j>0,所以终止条件就是  i==0 ||  j==0

代码如下:



反思与总结:

有时候应该打破惯性,打破我们惯常的以静制动的思维,

让两者都动,可能产生意想不到的好处。

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 最长公共子序列(Longest Common Subsequence)指的是在两个序列中找到最长公共子序列,这个公共子序列可以不连续,但是需要保持相对顺序不变。例如,对于序列ABCD和ACDFG,它们的最长公共子序列是ACD。 ### 回答2: 最长公共子序列(Longest Common Subsequence,简称LCS)是指在给定多个序列中,找到最长的一个子序列,该子序列同时出现在这些序列中,并且其他元素的相对顺序保持一致。 举个例子,假设有两个序列A和B,A为[1, 2, 3, 4, 5],B为[2, 4, 5, 6]。它们的一个最长公共子序列是[2, 4, 5],该子序列同时存在于A和B中。 求解LCS的问题可以用动态规划的方法来解决。我们可以构建一个二维数组dp,其中dp[i][j]表示序列A的前i个元素和序列B的前j个元素的LCS长度。那么dp[i][j]可以通过以下方式得到: 1. 如果A[i]等于B[j],则dp[i][j]等于dp[i-1][j-1] + 1; 2. 如果A[i]不等于B[j],则dp[i][j]等于max(dp[i-1][j], dp[i][j-1])。 通过填充整个dp数组,最终可以得到序列A和序列B的LCS长度。要找到具体的LCS序列,则可以通过反向遍历dp数组进行构建。 LCS问题在字符串处理、DNA序列匹配、版本控制等领域都有广泛的应用。其时间复杂度为O(m*n),其中m和n分别为序列A和序列B的长度。 ### 回答3: 最长公共子序列(Longest Common Subsequence)是一个经典的计算机科学问题。给定两个序列S和T,我们要找出它们之间最长公共子序列。 子序列是从给定序列中按顺序选择几个元素而组成的序列。而公共子序列指的是同时是序列S和T的子序列的序列。 为了解决这个问题,可以使用动态规划的方法。我们可以定义一个二维数组dp,其中dp[i][j]表示序列S的前i个元素和序列T的前j个元素之间的最长公共子序列的长度。 接下来,我们可以使用以下递推关系来填充dp数组: 如果S[i]等于T[j],则dp[i][j] = dp[i-1][j-1] + 1; 如果S[i]不等于T[j],则dp[i][j] = max(dp[i-1][j], dp[i][j-1])。 最后,我们可以通过查看dp[S.length()][T.length()]来得到最长公共子序列的长度。 此外,我们也可以用回溯法来还原最长公共子序列本身。我们可以从dp[S.length()][T.length()]开始,如果S[i]等于T[j],则将S[i]添加到结果序列中,并向左上方移动,即i = i-1,j = j-1。如果S[i]不等于T[j],则根据dp数组的值选择向上(i = i-1)或向左(j = j-1)移动。 总之,最长公共子序列问题是一个经典的计算机科学问题,可以使用动态规划的方法解决。我们可以通过构建二维dp数组来计算最长公共子序列的长度,并可以使用回溯法来还原它本身。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值