树状数组优化最长公共子序列（LCS）

winsunboy

已于 2024-08-07 15:55:41 修改

阅读量627

点赞数 13

分类专栏：总结文章标签：动态规划 c++ 算法

于 2024-08-07 15:50:47 首次发布

本文链接：https://blog.csdn.net/winsunboy/article/details/140991389

版权

总结专栏收录该内容

4 篇文章 0 订阅

订阅专栏

树状数组优化 LCS

众所周知，树状数组可以将 LIS 优化到 $\log n)$ 的时间复杂度（见往期：树状数组优化 LIS）。你可能不知道的是，树状数组还能优化 LCS，在 $a_i$ 两两不同的时候可以达到 $\log n)$ ，但是在构造数据的情况下可以退化到 $O(n^2 \log n)$ 。不过因为树状数组基于位运算，常数很小，仍能通过。

Luogu 1439 最长公共子序列（特殊版）

给出 $1,2,\ldots,n$ 的两个排列 $P_1$ 和 $P_2$ ，求它们的最长公共子序列。

记顺序处理完 $P_2$ 的前 $(i - 1)$ 位后的 $f (x)$ 为： $P_1$ 以 第 $x$ 位结尾 的子序列，与 $P_2$ 的前 $(i - 1)$ 位的最大公共部分的长度。

注意： $f (x)$ 对应的 $P_1$ 需要以第 $x$ 位结尾，而 $P_2$ 不需要以第 $(i - 1)$ 位结尾。

那么当处理到第 $i$ 位时，我们知道只有 $P_1$ 中数值等于 $P_{2, i}$ 的位置，它的 $f (x)$ 才会发生改变。

而根据定义，显然 $\displaystyle f(x) = \max_{1 \le y < x} \{f(y)\} + 1$ 。

分析可知，只需要记录在 $P_1$ 中每个数值出现的位置 $x$ ，用树状数组即可维护 $\displaystyle\max_{1 \le y < x} \{f(y)\}$ 。

最终的答案就是 $[1, n]$ 中 $f (x)$ 的最大值。

时间复杂度 $\log n)$ 。

核心代码：

// 树状数组略
int query(int);
int update(int, int);
int n, id[MAXN];

scanf("%d", &n);
for (int i = 1; i <= n; ++i) {
    int x;
    scanf("%d", &x);
    id[x] = i;
}
for (int i = 1; i <= n; ++i) {
    int x;
    scanf("%d", &x);
    update(id[x], query(id[x]-1) + 1);
}
printf("%d\n", query(n));

普通版

给定序列 $a_1, a_2, \dots, a_n$ 和 $b_1, b_2, \dots, b_m$ ，可能存在 $\ne j$ 且 $a_i = a_j$ 的情况，求两个序列的 LCS。

每个数并不恰好只出现一次，那么应该怎么办？

开个 vector 记录每个数每次出现的位置，更新的时候对 $b_i$ 在 $a$ 中出现过的每一个位置倒序更新。

倒序更新使得当前 query() 到的都是上一阶段的结果，进而这一阶段处理过的状态，不会对决策产生干扰。

// 输入及树状数组略。
int query(int);
int update(int, int);
int n, m, a[MAXN], b[MAXM];
vector<int> idx[1005];

for (int i = 1; i <= n; ++i) {
    idx[a[i]].push_back(i);
}
for (int i = 1; i <= m; ++i) {
    for (int j = idx[b[i]].size()-1; j >= 0; --j) {
        update(idx[b[i]][j], query(idx[b[i]][j] - 1) + 1);
    }
}
printf("%d\n", query(n));

记 $c_x$ 为 $x$ 在 $a$ 中出现的次数。时间复杂度为 $O(\sum_{i=1}^m c_{b_i} \log n)$ 。

若 $\forall 1 \le i < j \le n$ ， $a_i = a_j$ ，且 $\forall 1 \le i < j \le m$ ， $b_i = b_j$ ，可以退化到 $\log n)$ 。

若 $a_i$ 和 $b_j$ 分别两两不同，就是特殊版的情况，时间复杂度为 $\log n)$ 。

Luogu 2516 [HAOI2010] 最长公共子序列（求方案数）

给树状数组加个计算方案数的功能就可以了。dijkstra 最短路求方案数怎么求，这里也可以怎么求。注意累加的时候要取模。传引用也行，如果你写成返回 pair<int, int> 也行。另外本人亲测，就算卡到 $O(n^2 \log n)$ ，也就 100~300ms 的样子。~~今天随手交到了最优解第一？~~

#include <cstdio>
#include <cstring>
#include <vector>

using namespace std;

const int MAXN = 5e3+5;
const int mod = 1e8;

char buf[MAXN];
int n, m;
vector<int> idx[26];
int f[MAXN], c[MAXN]; // 长度，方案数

void update(int p, int val, int cnt) {
    for (; p <= n; p += p & -p) {
        if (val > f[p]) {
            f[p] = val, c[p] = cnt;
        } else if (val == f[p]) {
            c[p] = (c[p] + cnt) % mod;
        }
    }
}

void query(int p, int& val, int& cnt) {
    val = 0;
    for (; p; p -= p & -p) {
        if (f[p] > val) {
            val = f[p], cnt = c[p];
        } else if (f[p] == val) {
            cnt = (cnt + c[p]) % mod;
        }
    }
}

int main() {
    #ifndef ONLINE_JUDGE
    freopen("lcs.in", "r", stdin);
    freopen("lcs.out", "w", stdout);
    #endif
    scanf("%s", buf + 1);
    n = strlen(buf + 1) - 1;
    for (int i = 1; i <= n; ++i) {
        idx[buf[i] - 'A'].push_back(i);
    }
    scanf("%s", buf + 1);
    m = strlen(buf + 1) - 1;
    for (int i = 1; i <= m; ++i) {
        int pos = buf[i] - 'A';
        for (int j = idx[pos].size()-1; j >= 0; --j) {
            int val, cnt;
            query(idx[pos][j] - 1, val, cnt);
            if (!val) cnt = 1; // 特判一下
            ++val;
            update(idx[pos][j], val, cnt);
        }
    }
    int ans1, ans2;
    query(n, ans1, ans2);
    printf("%d\n%d\n", ans1, ans2);
    return 0;
}

LCS 与 LIS 的关系

// LIS
// a[i] 是离散化后的序列, 最大值为 n, 长度为 m.
for (int i = 1; i <= m; ++i) {
    update(a[i], query(a[i] - 1) + 1);
}
printf("%d\n", query(n));

// LCS
for (int i = 1; i <= m; ++i) {
    for (int j = idx[b[i]].size()-1; j >= 0; --j) {
        update(idx[b[i]][j], query(idx[b[i]][j] - 1) + 1);
    }
}
printf("%d\n", query(n));

对比两段核心代码，不难发现它们的相似之处。

LCS 的 idx[b[i]][j]，恰恰是 LIS 中的 a[i]。求 LCS 的过程，就等价于把 idx[b[i]][j] 依次排成一个新的序列，然后对这个新的序列求 LIS。

从某种角度上说，优化的过程，就是把它转化成 LIS，并利用 LIS 的 $\log n)$ 进行计算的过程。当然转化后的序列，长度并不一定还是原来的 $n$ ，极端情况下甚至可以变成 $n^2$ 。所以：看题目的情况，小心负优化。

winsunboy

关注

13
点赞
踩
22

收藏

觉得还不错? 一键收藏
0
评论
树状数组优化最长公共子序列（LCS）

众所周知，树状数组可以将 LIS 优化到Onlogn你可能不知道的是，树状数组还能优化 LCS，在ai两两不同的时候可以达到Onlogn，但是在构造数据的情况下可以退化到On2logn。不过因为树状数组基于位运算，常数很小，仍能通过。
复制链接

扫一扫