LCS 小讲

最新推荐文章于 2023-08-14 09:21:16 发布

Joursion

最新推荐文章于 2023-08-14 09:21:16 发布

阅读量610

点赞数

分类专栏： ACM - 学习笔记文章标签： lcs 动态规划

ACM - 学习笔记专栏收录该内容

40 篇文章 0 订阅

订阅专栏

首先要明确的是子序列的概念，注意啦，子序列不等于子串。子序列是一个字符串S去掉零个或者多个字符后所剩下的字符串就叫做子序列。

最长公共子序列的意思就是寻找两个给定字符串的的子序列，该子序列在两个字符串中以相同的次序出现，但是不一定是连续的。（连续的那是子串）

例如序列X=ABCBDAB，Y=BDCABA。序列BCA是X和Y的一个公共子序列，但是不是X和Y的最长公共子序列，子序列BCBA是X和Y的一个LCS，序列BDAB也是。

最简单想到的寻找LCS的一种方法是枚举X所有的子序列，然后逐一检查是否是Y的子序列，并随时记录发现的最长子序列。假设X有m个元素，则X有2^m个子序列，指数级的时间，对长序列不实际。

其实最长公共子序列是动态规划（DP）的典型例子。

设X=<x₁,x₂,…,x_m>和Y=<y₁,y₂,…,y_n>为两个字符串，LCS(X,Y)表示X和Y的一个最长公共子序列，可以看出

如果x_m=y_n，则LCS ( X,Y ) = x_m + LCS ( X_m-1,Y_n-1)。
如果x_m!=y_n，则LCS( X,Y )= max{ LCS ( X_m-1, Y ), LCS ( X, Y_n-1 ) }

LCS问题也具有重叠子问题性质：为找出X和Y的一个LCS，可能需要找X和Y_n-1的一个LCS以及X_m-1和Y的一个LCS。但这两个子问题都包含着找X_m-1和Y_n-1的一个LCS，等等.

DP最终处理的还是数值（极值做最优解），找到了最优值，就找到了最优方案；为了找到最长的LCS，我们定义dp[i][j]记录序列LCS的长度，合法状态的初始值为当序列X的长度为0或Y的长度为0，公共子序列LCS长度为0，即dp[i][j]=0，所以用i和j分别表示序列X的长度和序列Y的长度，状态转移方程为

dp[i][j] = 0 如果i=0或j=0
dp[i][j] = dp[i-1][j-1] + 1 如果X[i-1] = Y[i-1] （X[i-1]就是X数组中的第i个）
dp[i][j] = max{ dp[i-1][j], dp[i][j-1] } 如果X[i-1] != Y[i-1]

#include <iostream>
using namespace std;
 
/* LCS
 * 设序列长度都不超过20
*/
 
int dp[21][21]; /* 存储LCS长度, 下标i,j表示序列X,Y长度 */
char X[21];
char Y[21];
int i, j;
 
void main()
{
    cin.getline(X,20);
    cin.getline(Y,20);
 
    int xlen = strlen(X);
    int ylen = strlen(Y);
 
    /* dp[0-xlen][0] & dp[0][0-ylen] 都已初始化0 */
    for(i = 1; i <= xlen; ++i)
    {
        for(j = 1; j <= ylen; ++j)
        {
            if(X[i-1] == Y[j-1])
            {
                dp[i][j] = dp[i-1][j-1] + 1;
            }else if(dp[i][j-1] > dp[i-1][j])
            {
                dp[i][j] = dp[i][j-1];
            }else
            {
                dp[i][j] = dp[i-1][j];
            }
        }
    }
    printf("len of LCS is: %d\n", dp[xlen][ylen]);
 
    /* 输出LCS 本来是逆序打印的，可以写一递归函数完成正序打印
       这里采用的方法是将Y作为临时存储LCS的数组，最后输出Y
    */

i = xlen;
j = ylen;
int k = dp[i][j];
char lcs[21] = {'\0'};
while(i && j)
{
     if(X[i-1] == Y[j-1] && dp[i][j] == dp[i-1][j-1] + 1)
     {
         lcs[--k] = X[i-1];
         --i; --j;
     }else if(X[i-1] != Y[j-1] && dp[i-1][j] > dp[i][j-1])
     {
        --i;
     }else
     {
         --j;
     }
}
printf("%s\n",lcs);
}

Joursion

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
LCS 小讲

首先要明确的是子序列的概念，注意啦，子序列不等于子串。子序列是一个字符串S去掉零个或者多个字符后所剩下的字符串就叫做子序列。最长公共子序列的意思就是寻找两个给定字符串的的子序列，该子序列在两个字符串中以相同的次序出现，但是不一定是连续的。（连续的那是子串）例如序列X=ABCBDAB，Y=BDCABA。序列BCA是X和Y的一个公共子序列，但是不是X和Y的最长公共子序列，子
复制链接

扫一扫

专栏目录