算法竞赛进阶指南读书笔记——0x06倍增

最新推荐文章于 2024-10-14 09:08:48 发布

wxxcl0825

最新推荐文章于 2024-10-14 09:08:48 发布

阅读量152

点赞数 2

分类专栏：算法学习文章标签：算法 c++

本文链接：https://blog.csdn.net/qq_37638320/article/details/127858242

版权

算法学习专栏收录该内容

13 篇文章 1 订阅

订阅专栏

本文介绍了倍增算法在处理数列查询与优化问题中的两种应用：在线求解前缀和最大值问题和RMQ（Range Maximum Query）问题。通过倍增与二分查找的结合，提高了算法效率，避免了全量计算。对于前缀和问题，通过倍增和二进制划分降低查询复杂度；对于RMQ问题，利用倍增状态转移求解区间最大值。这两种方法均在保证正确性的前提下，有效地减少了计算量。

摘要由CSDN通过智能技术生成

倍增

应用：进行递推时，若状态空间过大，则只推出 $2^k$ 位置上的值。当需要其它位置上的值时，利用任意整数可以表示为若干个2的次幂项之和的性质从 $2^k$ 位置的值中拼出结果。

例1 给定长度为 $N$ 的数列 $a$ ，然后在线询问若干次，每次给定一个整数 $T$ ，求 $k_{max}\space s.t.\sum\limits_{i=1}^ka_i\leqslant T$ . $(0\leqslant T\leqslant\sum\limits_{i=1}^Na_i)$

思路1：二分查找

对 ${a_n\}$ 进行预处理求出前缀和 $S_n$ ，然后二分 ${S_n\}$ 找 $k_{max}\space s.t.S_k\leqslant T$ .

由于每次查找平均花费 $O (l o g N)$ ，当 $k$ 较小时不如直接遍历。

思路2：倍增+二进制划分

先考虑这样一个问题：如何将一个未知的数 $n$ 进行二进制分解？

若我们从低位开始分解，由于我们并不知道 $n$ 的值，无法确认当前位上的是0还是1，所以无法进行分解。

当我们从高位开始分解时，若找到 $k_0\space s.t.2^{k_0}>n$ ，我们能确定 $\forall k\geqslant k_0,2^k\geqslant2^{k_0}>n$ ，即 $n$ 的第 $k_0$ 位及以上都不可能是1。

从 $k_0$ 向下寻找到第一个 $k_1\space s.t.2^{k_1}\leqslant n$ ，我们能确定 $n$ 的第 $k_1$ 位一定是1。否则若 $k_1$ 位不是1，那么 $n\leqslant \sum\limits_{k=0}^{k_1-1}2^k=2^{k_1}-1<2^{k_1}\leqslant n\Rightarrow n<n$ ，矛盾！所以 $n$ 的第 $k_1$ 位是1。

从 $n$ 中扣除 $2^{k_1}$ 后，问题转化为分解 $n-2^{k_1}$ ，重复上述步骤即可将 $n$ 完全分解。

所以我们要构造一种能使得从高位进行二进制分解的情形。

为此，我们分两个阶段来进行：

阶段1：倍增

依次考虑 $S_1,S_{1+2^1},S_{1+2^1+2^2},\dots$ ，直到出现 $S_{\sum_{i=0}^{k_0}2^i}>T$ 停止。此时 $k_{max}<\sum\limits_{i=0}^{k_0}2^i$ .令 $k=\sum\limits_{i=0}^{k_0-1}2^i$ ，则 $k_{max}-k<2^{k_0}$ ，可对 $k_{max}-k$ 进行二进制划分。

阶段2：二进制划分

依次考虑 $S_{k+2^{k_0-1}},S_{k+2^{k_0-2}},\dots$ ，若 $S_{k+2^{k_1}}\leqslant T$ ，则相当于找到了 $k_{max}-k$ 的二进制最高位 $k_1$ ；继续考虑 $S_{k+2^{k_1}+2^{k_1-1}},S_{k+2^{k_1}+2^{k_1-2}}\dots$ ，相当于对 $k_{max}-k-2^{k_1}$ 继续进行二进制分解。当 $k_m<0$ 时，分解完毕， $k_{max}=k+\sum\limits_{i=1}^{m-1}2^{k_i}$ .

实现：

int p = 1, k = 0, sum = 0;
while (p) {
    if (k + p <= N && sum + S[k + p] - S[k] <= T)
        sum += S[k + p] - S[k], k += p, p <<= 1; // 1.
    else p >>= 1;
}

细节：

1.数组 $a$ 下标从1开始。 $S_r-S_l$ 所求的是 $(l, r]$ 上的部分和，倍增过程即 $(0,1]+(1,1+2]+(1+2,1+2+4]+\dots=(0,1+2+4+\dots+2^{k_0-1}]=[1,k]$

由于二进制划分过程中下标仍递增，所以两个阶段可以合并，如图：

倍增与二分查找的比较：

倍增：利于已遍历状态空间的扩增（求增）

二分查找：利于有序状态空间的搜索（求全）

例2 Genius ACM

思路：倍增+二路归并

先解决校验值。当 $M = 1$ 时，显然 $S_{校验}=(\max S-\min S)^2$ .

当 $M = 2$ 时，参考 $M = 1$ 的情形将 $S$ 进行排序。若所取的数 $S_i$ 不为 $S_1,S_2,S_{n-1},S_n$ ，那么 $S_i-S_j|<\max(|S_1-S_j|,|S_2-S_j|,|S_{n-1}-S_j|,|S_n-S_j|)$ .因此，我们只需考虑 $S_1,S_2,S_{n-1},S_n$ 的组合方式即可。

又 $S_n-S_1)^2+(S_{n-1}-S_2)^2]-[(S_n-S_2)^2+(S_{n-1}-S_1)^2]=2S_1S_{n-1}+2S_2S_n$ $2S_1S_n-2S_2S_{n-1}=2S_2(S_n-S_{n-1})-2S_1(S_n-S_{n-1})=2(S_2-S_1)(S_n-S_{n-1})>0$ ，所以 $S_1$ 与 $S_n$ 组合， $S_2$ 与 $S_{n-1}$ 组合。

类似的，当 $M > 2$ 时我们可以进行类似的组合。

所以从头尾选数进行组合即可求得 $S_{校验}$ 。

此处的 $S_{校验}$ 类似于上题的前缀和，我们可以采用相同的框架进行求解。

需要注意的一个细节是，求 $S_{校验}$ 时，我们需要对目标区间 $[l, r]$ 进行排序。这里会出现两个问题，一是每次进行排序时需花费 $O (n l o g n)$ ，加上 $O (l o g n)$ 的倍增次数，算法复杂度为 $O(nlog^2n)$ ；二是排序会对原数组造成影响，例如判断 $[l, r + 2 k]$ 时对 $[l, r + 2 k]$ 进行了排序，若此时不符合条件，区间回退至 $[l, r + k]$ ，但 $[l, r + k]$ 中混入 $[r + k + 1, r + 2 k]$ 的元素导致错误。

第一个问题可以采用二路归并实现：当排序区间从 $[l,r]\rightarrow[l,r+p]$ 时，可以对 $[r + 1, r + p]$ 进行排序，再将 $[l, r], [r + 1, r + p]$ 进行归并，即可得到 $[l, r + p]$ 的有序区间。每次有效排序（即产生扩增时的排序）长度 $n_i$ 满足 $\sum n_i=n$ ，故 $\sum n_ilogn_i<\sum n_ilogn=nlogn$ ，复杂度降为 $O (n l o g n)$ .

解决第二个问题需要三个数组： $a [], b [], t e m p []$ ，其中 $a []$ 存储原数据， $t e m p []$ 为归并辅助数组， $b []$ 为部分有序数组。三个数组工作如下：

扩增过程： $[l, r + p]$ 符合条件，区间即从 $[l, r]$ 扩增到 $[l, r + p]$ .由于右端点只增不减，所以可以确定将有序的 $[l, r + p]$ 存入 $b []$ 不会导致后面元素的混入。

需要注意的是，我们不能仅将有序的 $[r + 1, r + p]$ 直接放入 $b []$ 中，因为对 $[l, r + p]$ 整体排序后， $[l, r]$ 部分也发生了改变，需将 $[l, r + p]$ 全部拷入。

试探过程：我们期望得到 $l,r+p_0]$ 的有序序列，而这次扩增是在 $[l, r]$ 基础上的，所以 $b []$ 中 $[l, r]$ 部分是有序的。为了实现二路归并的效果，我们应该把 $a[r+1,r+p_0]$ 拷入 $b []$ 中，并对 $b []$ 中该部分进行排序，再由归并后进入 $t e m p []$ 中。

此时 $t e m p []$ 中持有 $l,r+p_0]$ 的有序序列，所以可以直接在 $t e m p []$ 中求取 $S_{校验}$ .而传统的归并排序要求我们将 $t e m p []$ 拷入 $b []$ 中，但让未经确认的 $l,r+p_0]$ 进入 $b []$ 会使得 $r+1,r+p_0]$ 的元素混入 $[l, r]$ 中，从而产生未确定元素对已确定元素的破坏。

回到扩增过程，有序的 $[l, r + p]$ 的来源即是 $t e m p []$ ，在试探过程中已经排好序放入 $t e m p []$ 中，可以在试探成功后直接取用。

实现：

int a[N], b[N], temp[N], m, n;
long long t;
bool check(int l, int mid, int r) {
  if (r >= n)
    return 0;
  for (int i = mid + 1; i <= r; i++)
    b[i] = a[i];
  sort(b + mid + 1, b + r + 1); // STL区间左闭右开
  int i = l, j = mid + 1; // 二路归并
  for (int pos = l; pos <= r; pos++)
    if (j > r || (i <= mid && b[i] < b[j]))
      temp[pos] = b[i++];
    else
      temp[pos] = b[j++];
  long long res = 0;
  if (r - l + 1 <= 2 * m) // 数不够选
    for (int i = 0; 2 * i < r - l; i++) // l + i < r - i
      res += pow((temp[l + i] - temp[r - i]), 2);
  else
    for (int i = 0; i < m; i++)
      res += pow((temp[l + i] - temp[r - i]), 2);
  return res <= t;
}
int main() {
  int k, p, ans, l, r;
  cin >> k;
  while (k--) {
    cin >> n >> m >> t;
    for (int i = 0; i < n; i++)
      cin >> a[i];
    ans = 0, l = 0, r = 0;
    while (r < n) {
      p = 1, b[r] = a[r]; // 1.
      while (p) {
        if (check(l, r, r + p)) {
          r += p, p <<= 1;
          for (int i = l; i <= r; i++)
            b[i] = temp[i];
        } else
          p >>= 1;
      }
      ans++, l = ++r; // 1.
    }
    cout << ans << endl;
  }
  return 0;
}

细节：

1.当产生新的分段时， $l_1,r_1]$ 划分结束， $l_2=r_1+1,r_2=l_2$ 开始新的划分，但在试探过程中，我么假定了 $[l, r]$ 是有序序列，而有序序列应被拷入 $b []$ 中，所以每一次开始新的分段时，需将 $a [l] (a [r])$ 拷入 $b []$ 中以保证正确性。

ST算法

应用：求解RMQ问题

RMQ问题：给定长度为 $N$ 的数列 $a$ ，在线回答数组 $a$ 中下标在 $l\sim r$ 之间的数的最大值为多少

思路：倍增

根据倍增思想，我们希望引入成倍增长的量，易见区间长度是很好的选择。为了描述各个区间，规定长度后还需规定起点，所以我们将起点和长度作为状态描述的参量。

定义状态 $F[i][j]\triangleq \max\limits_{i\leqslant k\leqslant i+2^j-1}a_k$ ，即从 $a_i$ 开始区间长度为 $2^j$ （ $i+2^j-1-i+1=2^j$ ）的区间的最大值。边界为 $F[i][0]=a_i$ .

接着考虑状态转移，考虑到最大值的性质：两个区间合起来的最大值等于两个区间各自的最大值的最大值，所以 $F[i][j]=\max\{F[i][j-1],F[i+2^{j-1}][j-1]\}$ （前半个区间到 $i+2^{j-1}-1$ ，后半个区间从 $i+2^{j-1}$ 开始）

状态空间大小为 $n * l o g n$ ，故预处理 $F [n] [l o g n]$ 的时间复杂度为 $O (n l o g n)$ .

接着考虑查询过程。由于两个区间合起来的最大值等于两个区间各自的最大值的最大值，所以我们可以将待查区间分为两段（重合不影响合区间，只需要求两段区间的合将待查询区间覆盖即可）。结合我们定义的状态，我们可以考虑使用 $F [l] [k]$ 和 $F[r-2^k+1][k]$ 进行查询，如图：

故要求 $\left\{\begin{array}{ll}2^k\leqslant l-r+1, \\2\cdot2^k\geqslant l-r+1\end{array}\right.$ 取 $k=\lfloor log_2(l-r+1)\rfloor$ 即可( $p-1\leqslant p-1<\lfloor p\rfloor\leqslant p$ )。

实现：

for (int i = 1; i <= n; i++) f[i][0] = a[i];
int t = log[n]; // 1.
for (int j = 1; j <= t; j++)
    for (int i = 1; i <= n - (1 << j) + 1; i++) // 2.
        f[i][j] = max(f[i][j - 1], f[i + (1 << (j - 1))][j - 1]);

void query(int l, int r) {
    int k = log[r - l + 1];
    return max(f[l][k], f[r - (1 << k) + 1][k]);
}

细节：

1.此处使用预处理的 $l o g$ 表计算 $log_2n$ ，预处理 $l o g$ 表实现如下：

for (int i = 0; i <= n; i++)
    for (int j = 1 << i; j < 1 << (i + 1); j++) log[j] = i;

即 $\forall n\in[2^{i},2^{i+1}),n\in\N^*,\lfloor log_2n\rfloor=i$ .

或者可以使用 $c m a t h$ 库的 $l o g$ 函数，该函数以10为底。由换底公式知， $log_2n=\dfrac{lgn}{lg2}$ ，故 $l o g [n] = l o g (n) / l o g (2)$

2.状转方程右边的 $j - 1$ 小于左边的 $j$ ，所以需要按照 $j$ 递增的顺序进行枚举，故将 $j$ 放在外层循环；递推 $i$ 时需判断边界： $F [i] [j]$ 本身含义是 $i,i+2^j-1]$ ，故 $i+2^j-1\leqslant n\Leftrightarrow i\leqslant n-2^j+1$