LCS (Longest Common Subsequence)

一、最长公共子序列

一个数列 S,如果分别是两个或多个已知数列的子序列,且是所有符合此条件序列中最长的,则S称为已知序列的最长公共子序列。

最长公共子串(Longest CommonSubstring)最长公共子序列(LongestCommon Subsequence,LCS)的区别:子串是串的一个连续的部分,子序列则是从不改变序列的顺序,而从序列中去掉任意的元素而获得的新序列;更简略地说,子串的字符的位置必须连续,子序列则不必。比如字符串acdfgakdfc的最长公共子串为df,而他们的最长公共子序列是adf

最长公共子序列的结构有如下表示:

设序列X=<x1, x2, …, xm>Y=<y1, y2, …, yn>的一个最长公共子序列Z=<z1, z2, …, zk>,则:

xm=yn,则zk=xm=ynZk-1Xm-1Yn-1的最长公共子序列;
xm≠ynzk≠xm ,则ZXm-1Y的最长公共子序列;
xm≠ynzk≠yn ,则ZXYn-1的最长公共子序列。
其中Xm-1=<x1, x2, …, xm-1>Yn-1=<y1, y2, …, yn-1>Zk-1=<z1, z2, …, zk-1>

因此可以根据这个方程来进行填表,以"helloworld"和“loop”为例:

0helloworld
000000000000
l00011111111
o00011222222
o00011223333
p00011223333

所以"helloworld"和"loop"的最长公共子序列的长度为3。

代码:
// 最长公共子序列(不连续)
int lcs_length_(const wstring &str1, const wstring &str2) {
    
    if (str1.size() == 0 || str2.size() == 0)
        return 0;
  
    int m = str1.size();
    int n = str2.size();
    
    // 生成二维容器
    vector<vector<int>> dp(m + 1, vector<int>(n + 1));
    int i, j;
	
    // 初始化矩阵,第一行和第一列为0,
    for (i = 0; i <= m; i++) {
        dp[i][0] = 0;
    }
    for (j = 0; j <= n; j++) {
        dp[0][j] = 0;
    }
  	
    for (i = 1; i <= m; i++) {
        for (j = 1; j <= n; j++) {
            if (str1[i - 1] == str2[j - 1]) {       // xm=yn
                dp[i][j] = dp[i - 1][j - 1] + 1;
            } else {                                // xm≠yn
                if (dp[i - 1][j] >= dp[i][j - 1])   
                    dp[i][j] = dp[i - 1][j];          // zk≠xm
                else
                    dp[i][j] = dp[i][j-1];            // zk≠yn
            }
        }
    }
    return dp[m][n];
}

二、最长公共字串

最长公共子串跟最长公共子序列的唯一区别在于,公共子串要求是连续的,子序列要求不一定连续。
具体的思路还是动态规划,不同点在于动态规划的迭代策略。

和LCS问题唯一不同的地方在于当xm≠yn 时,最长公共字串就直接等于0了,因为子串必须连续,且最长公共字串表示的是以xmyn截尾的公共子串的长度。

因此可以根据这个方程来进行填表,以"helloworld"和“loop”为例

0helloworld
000000000000
l00011000010
o00000201000
o00000101000
p00000000000

这个和LCS问题还有一点不同的就是,需要设置一个MAX,每一步都更新得到最长公共子串的长度。

代码:
// 最长公共子串(连续)
int lcs2_length_(const wstring &str1, const wstring &str2) {
    if (str1.size() == 0|| str2.size() == 0)
        return 0;

    int m = str1.size();
    int n = str2.size();
    vector<vector<int>> dp(m + 1, vector<int>(n + 1));
    int i, j;
    int max = 0;

    for (i = 0; i <= m; i++) {
        dp[i][0] = 0;
    }
    for (j = 0; j <= n; j++) {
        dp[0][j] = 0;
    }
    for (i = 1; i <= m; i++) {
        for (j = 1; j <= n; j++) {
            if (str1[i - 1] == str2[j - 1]) {
                dp[i][j] = dp[i - 1][j - 1] + 1;
                if (dp[i][j] > max) {
                    max = dp[i][j];     // 更新最长公共子串
                }
            }
            else {
                dp[i][j] = 0;
            }
        }
    }
    return max;
}
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值