最长公共上升子序列

最新推荐文章于 2020-08-19 22:55:03 发布

Jokercold

最新推荐文章于 2020-08-19 22:55:03 发布

阅读量375

点赞数

分类专栏：动态规划

动态规划专栏收录该内容

14 篇文章 0 订阅

订阅专栏

最 长 公 共 上 升 子 序 列

$最长公共上升子序列$

问 题 :

$问题:$

给 定 两 个 字 符 串 x, y, 求 它 们 公 共 子 序 列 s,

$给定两个字符串x, y, 求它们公共子序列s,$

满 足 s i < s j (0 < = i < j < | s |) . 要 求 S 的 长 度 是 所 有 条 件 序 列 中 长 度 最 长 的 .

$满足si < sj ( 0 <= i < j < |s|).要求S的长度是所有条件序列中长度最长的.$

比较直观的做法(O(n^4))

可 以 仿 照 最 长 上 升 子 序 列 用 d p [i] [j], 表 示 以 x i, y j 结 束 的 公 共 字 串 的 长 度 . s o, 我 们 可 以 得 出 递 推 公 式

$可以仿照最长上升子序列用dp[i][j], 表示以xi, yj结束的公共字串的长度. so, 我们可以得出递推公式$

if xi != yj
    dp[i][j] = 0
else
    dp[i][j] = max(dp[ii][ij]) ( 0 <= ii < i, 0 <= ij < j, dp[ii][ij] != 0 && x[ii] < x[i]) + 1

时 间 复 杂 是 O (n 4)

$时间复杂是O(n^4)$

O(n^3)的算法

L I C S 是 从 L I S 和 L C S 演 变 而 来 的 . 我 们 来 看 看 L I S 和 L C S 的 动 态 规 划 解 决 方 法 .

$LICS是从LIS和LCS演变而来的.我们来看看LIS和LCS的动态规划解决方法.$

在 L I S 中 d p [i] 表 示 以 x i 结 束 的 最 长 上 升 子 序 列 的 长 度 .

$在LIS中dp[i]表示以xi结束的最长上升子序列的长度.$

在 L C S 中 d p [i] [j] 表 示 x [0 \dots i] 和 y [0 \dots j] 的 最 长 公 共 字 串 的 长 度 .

$在LCS中dp[i][j]表示x[0…i]和y[0…j]的最长公共字串的长度.$

为 什 么 在 L I S 中 d p [i] 表 示 的 不 是 x [0 \dots i] 中 的 最 长 子 序 列 的 长 度 ?

$为什么在LIS中dp[i]表示的不是x[0…i]中的最长子序列的长度?$

因 为 在 算 L I S 中 d p [i] 的 时, 需 要 知 道 上 一 次 字 符 的 信 息, 这 样 才 能 判 断 是 否 把 x [i] 加 入

$因为在算LIS中dp[i]的时, 需要知道上一次字符的信息, 这样才能判断是否把x[i]加入$

. 而 在 计 算 L C S 中 d p [i] [j] 是 不 需 要 知 道 上 一 字 符 的 信 息, 只 考 虑 当 前 字 符 就 可 以 .

$.而在计算LCS中dp[i][j]是不需要知道上一字符的信息, 只考虑当前字符就可以.$

在 L I C S 中, 和 L I S 中 一 样, 我 们 需 要 知 道 上 一 字 符 的 信 息, d p [i] [j], x i 和 y j 就 是 上 一 字 符 信 息

$在LICS中, 和LIS中一样, 我们需要知道上一字符的信息, dp[i][j], xi和yj就是上一字符信息$

如 果 x i, y i 相 等, 则 信 息 重 复 冗 余, 我 们 可 以 试 着 消 除 冗 余, 以 得 到 一 个 更 好 的 算 法 .

$如果xi, yi 相等, 则信息重复冗余, 我们可以试着消除冗余, 以得到一个更好的算法.$

这 样 我 们 可 以 定 义 d p [i] [j] 表 示 x [0 \dots i] 和 y [0 \dots j] 上 的 L I C S, 并 且 在 y 中 的 结 束 位 置 为 j .

$这样我们可以定义dp[i][j]表示x[0…i]和y[0…j]上的LICS, 并且在y中的结束位置为j.$

s o, 我 们 可 以 得 到 递 归 公 式

$so, 我们可以得到递归公式$

if xi != yj
    dp[i][j] = dp[i-1][j]
else
    dp[i][j] = max(dp[i-1][k])(0 < k < j && y[k] < y[j]) + 1

证 明 :

$证明:$

设 x [0... m] 和 y [0... n] 上 的, 以 y [n] 为 结 束 字 符 的 最 长 公 共 上 升 子 序 列 为 z [0... z n] .

$设x[0...m]和y[0...n]上的, 以y[n]为结束字符的最长公共上升子序列为z[0...zn].$

若 x [m]! = y [n], 则 显 然 z [0... z n] 为 x [0... m - 1] 和 y [0... n] 上 的, 以 y [n] 为 结 束 的 L I C S .

$若x[m] != y[n], 则显然z[0...zn]为x[0...m-1]和y[0...n]上的, 以y[n]为结束的LICS.$

若 x [m] = = y [n], 则 z [0... z n - 1] 必 为 x [0... m - 1] 和 y [0... k] 上 的, 以 y [k] 为 结 束 的 最 长 的 L I C S (0 < k < j), 否 则 会 得 出 矛 盾 .

$若x[m] == y[n], 则z[0...zn-1]必为x[0...m-1]和y[0...k]上的, 以y[k]为结束的最长的LICS( 0 < k < j), 否则会得出矛盾.$

反证:
设s, s[0...sn]为x[0...m-1]和y[0...k]上的, 以x[k]为结束的一个LICS, 并且sn > zn-1.

那么,s[0...sn] 可以加上y[n], 得到长度sn+1的一个以y[n]为结束字符的最长公共上升子序列, sn+1 > zn, 与假设矛盾.

所 以 ， 上 述 的 递 推 公 式 的 是 对 的 .

$所以，上述的递推公式的是对的.$

时 间 复 杂 度 为 O (n 3) .

$时间复杂度为O(n^3).$

O(n^2)对O(n^3)的一个优化.

我 们 看 到, d p [i] [j] 依 赖 于 d p [k] [j - 1] (0 < k < i) .

$我们看到, dp[i][j]依赖于dp[k][j-1] (0 < k < i).$

在 计 算 的 时 候 可 以 把 i 作 为 外 层 循 环 ， 也 可 以 把 i 作 为 内 层 循 环 .

$在计算的时候可以把i作为外层循环，也可以把i作为内层循环.$

如 果 把 i 做 为 外 层 循 环 的, 可 以 做 一 个 优 化, 把 时 间 复 杂 度 将 为 O (n 2) .

$如果把i做为外层循环的, 可以做一个优化, 把时间复杂度将为O(n^2).$

memset(dp, 0, sizeof(dp));
for (i = 1; i <= m; i++) {
    for(j = 1; j <= n; j++) {
        dp[i][j] = 0;
        if (x[i] != y[j]) {
            dp[i][j] = dp[i-1][j];
        } else {
            for (k = 1; k < j; ++k) {
                if (dp[i][j] < dp[i - 1][k] && y[k] < y[j]) {
                    dp[i][j] = dp[i - 1][k];
                }
            }
            dp[i][j] += 1;
        }

如 果 优 化, 就 只 能 优 化 当 x [i] = y [j] 的 时, d p [i] [j] 的 计 算 .

$如果优化, 就只能优化当x[i] = y[j]的时, dp[i][j]的计算.$

因 为 现 在 O (n 2) 个 子 问 题 ， 这 是 怎 么 搞 也 搞 不 掉 的 .

$因为现在O(n^2)个子问题，这是怎么搞也搞不掉的.$

看 这 段 代 码 :

$看这段代码:$

for (k = 1; k < j; ++k) {
    if (dp[i][j] < dp[i - 1][k] && y[k] < y[j]) {
        dp[i][j] = dp[i - 1][k];
    }
}

当 y [j] = x [i] 时, 就 等 于

$当y[j] = x[i]时, 就等于$

for (k = 1; k < j; ++k) {
    if (dp[i][j] < dp[i - 1][k] && y[k] < x[i]) {
        dp[i][j] = dp[i - 1][k];
    }
}

这 是 在 求 d p [i - 1] [k] (0 < k < j) 中 的 满 足 y [k] < x [i] 最 大 值

$这是在求dp[i-1][k] (0 < k < j)中的满足y[k]< x[i]最大值$

因 为 i 是 不 变 的 (外 层 循 环), j 在 递 增, 因 此 没 有 必 要 从 头 计 算 .

$因为i是不变的(外层循环), j在递增, 因此没有必要从头计算.$

保 存 一 个 m l e n 变 量 保 存 d p [i - 1] [k] (0 < k < j) 中 的 满 足 y [k] < x [i] 最 大 值

$保存一个mlen变量保存dp[i-1][k] (0 < k < j)中的满足y[k]< x[i]最大值$

当 j 增 加 时 只 用 化 O (1) 的 时 间 更 新 m l e n 和 计 算 d p [i] [j] .

$当j增加时只用化O(1)的时间更新mlen和计算dp[i][j].$

代 码 如 下 :

$代码如下:$

for (i = 1; i <= m; i++) {
    mlen = 0;
    for(j = 1; j <= n; j++) {
        dp[i][j] = dp[i-1][j];
        //更新mlen
        if (y[j] < x[i] && dp[i - 1][j] > mlen) {
                mlen = dp[i - 1][j];
        }
        //计算dp[i][j]
        if (y[j] == x[i]) {
            dp[i][j] = mlen + 1;
        }
    }
}

时 间 复 杂 度 O (n 2)

$时间复杂度O(n^2)$

#include<iostream>
#include<cstdio>
#include<algorithm>
using namespace std;
int f[5005][5005];
int a[5005],b[5005];
int yh[5005];
int pre[5005][5005];
int main(){
  int n;
  scanf("%d",&n);
  for (int i=1;i<=n;++i) scanf("%d",&a[i]);
  int m;
  scanf("%d",&m);
  for (int i=1;i<=m;++i) scanf("%d",&b[i]);
  int ans=0;
    int x=n;
    int y=m;
  for (int i=1;i<=n;++i){
      int len=0;
      int last=0;
    for (int j=1;j<=m;++j){
        f[i][j]=f[i-1][j];
            if (a[i]>b[j]&&f[i-1][j]>len) len=f[i-1][j],last=j;
        if (a[i]==b[j]) f[i][j]=len+1,pre[i][j]=last;
            if (f[i][j]>ans){
              y=j;
              ans=f[i][j];
            }
        }
    }
    printf("%d\n",ans);
    int tail=0;
    while(ans--){
    yh[++tail]=b[y];
    while(a[x]!=b[y]) x--;
    y=pre[x][y];
    x--;
  }
    for (int i=tail;i>=2;--i) printf("%d ",yh[i]);
    printf("%d\n",yh[1]);
  return 0;
}