动态规划的优化

最新推荐文章于 2024-10-20 15:01:46 发布

原创最新推荐文章于 2024-10-20 15:01:46 发布 · 1.7k 阅读

7 ·

CC 4.0 BY-SA版权

文章标签：

#动态规划 #算法

算法专栏收录该内容

21 篇文章

订阅专栏

文章介绍了动态规划在解决优化问题时的几种常见优化技巧，包括空间优化如滚动数组应用于0-1背包问题，单调队列优化用于处理具有单调性的状态转移，以及斜率优化在处理涉及斜率比较的问题中的应用。这些技术可以显著提高算法的效率并减少空间复杂度。

动态规划的优化

一、空间优化

说明

动态规划空间优化为滚动数组优化，即对于一个多维数组，转移时均是由上一阶段转移来的，则可以将这一维省略，以降低空间复杂度，但要注意转移时的顺序；

例题

0 - 1 背包问题

题目

有一个最多能装 $m$ 千克的背包，有 $n$ 件物品，它们的重量分别是 $W_1，W_2，..., W_n$ ，它们的价值分别是 $C_1，C_2，... ，C_n$ ；

若每种物品只有一件，问能装入的最大总价值；

分析

状态

由于最终价值与物品与重量有关，所以可定义状态， $d p [i] [j]$ 表示前 $i$ 件物品装在容量为 $j$ 的背包中所能装入的最大总价值；

转移

依次遍历每一个物品与背包容量，比较取与不取当前物品的价值；

状态转移方程

$\max \begin{cases} dp[i- 1][j] \; (j < w[i]) \\ dp[i - 1][j - w[i]] + c[i] \end{cases}$

优化

在 $d p [i] [j]$ 转移时，对于枚举物品这一维只用了 $i$ 与 $i - 1$ 两个状态，在数组中即为，

dp	$j - w [i]$	…	$j$
$i - 1$	$d p [i - 1] [j - w [i]]$	…	$d p [i - 1] [j]$
$i$		…	$d p [i] [j]$

即在 $d p [i] [j]$ 的转移中，均是通过 $d p [i - 1]$ 这一维的状态转移过来的，则转移时只保存上一阶段的所有状态和当前阶段的所有状态即可，再利用这两个数组不断滚动计算，则可以得到最后一阶段的最后一个状态；

既可以优化为，

$d p [j]$ :容量为 $j$ 的背包装下物品的价值的最大值；

但在计算 $d p [j]$ 时，需要用到 $d p [j - w [i]]$ ，如果 $j$ 从小到大枚举，则 $d p [j - w [i]]$ 则为当前状态 $i$ 的，不是 $i - 1$ 的状态，所以 $j$ 应从大到小枚举；

依次遍历每一个物品与背包容量，比较取与不取当前物品的价值；

状态转移方程

$ dp[j] = \max {dp[j], dp[j - w[i]] + c[i] } $

代码

#include <cstdio>
#include <algorithm>
#define MAXN 20
#define MAXX 105
using namespace std;
int n, v, w[MAXN], c[MAXN], dp[MAXX];
int main() {
	scanf("%d %d", &n, &v);
	for (int i = 1; i <= n; i++) {
		scanf("%d %d", &w[i], &c[i]);
	}
	for (int i = 1; i <= n; i++) { // 遍历物品
		for (int j = v; j >= w[i]; j--) { // 反向枚举
			dp[j] = max(dp[j], dp[j - w[i]] + c[i]); // 状态转移
		}
	}
	printf("%d", dp[v]);
	return 0;
}

二、单调队列优化

说明

单调队列就是队内元素保持一定单调性的队列，即从队首到队尾单调递增或递减的队列；

可借助单调队列的单调性及时排除不可能的决策，保持候选集合的有效性与秩序性；

即对于形如 $dp[i] = \max_{j = a(a < i)}^{i - 1}\{dp[j] + x(i, j)\}$ 的状态转移方程，可使用单调队列优化，维护一个单调递增或递减的单调队列，将 $d p$ 数组全部存入单调队列中；

但为了方便判断单调队列中的状态是否满足 $j$ 的范围，一般在单调队列中存储下标；

对于 $d p [i]$ 更新时，先将单调队列中不满足 $j$ 的范围的状态从队列中删除，再利用单调队列的单调性选出对于 $d p [i]$ 的最优 $d p [j]$ ，用其更新 $d p [i]$ ，再将 $d p [i]$ 存入队列中继续更新；

例题

Mowing the Lawn G

题目

有 $\leq N \leq 10^5)$ 只奶牛，已知每只奶牛的效率 $E_i$ ，选取一种方案，使该方案中没有连续的超过 K 只奶牛且奶牛的效率总和最大；

分析

状态

由于要求不能有连续 $K$ 只奶牛存在，所以定义状态为，

$d p [i] [0/1]$ 表示前 $i$ 只奶牛选 (1) 与不选 (0) ；

转移

对于第 $i$ 只奶牛，

若不选第 $i$ 只，则比较前 $i - 1$ 只中第 $i - 1$ 只选与不选的最大值即可；

若选第 $i$ 只，则枚举 $\leq j < i)$ ，选取 $\sim i$ 这一区间的奶牛；

状态转移方程即为，
$dp[i][0] = \max\{dp[i - 1][0], dp[i - 1][1]\} \\ dp[i][1] = \max_{j = i - k}^{i - 1}\{dp[j][0] − sum[j] + sum[i]\}$
时间复杂度为 $O (N * N)$ ，考虑优化；

对于 $d p [i] [1]$ 的方程，可将 $s u m [i]$ 提出，得 $dp[i][1] = \max_{j = i - k}^{i - 1}\{dp[j][0] − sum[j]\} + sum[i]\}$ ，则可使用单调队列优化，维护一个递减单调队列；

依次遍历 $n$ 个物品，若当前物品编号为 $i$ 则，

先更新 $d p [i] [0]$ 的值；

将单调队列存储的候选优解中下标不满足 $j$ 范围的从单调队列中删除；

用单调队列的队首元素更新 $d p [i]$ 的值；

将下标 $i$ 存入单调队列中，但为维护单调队列的单调性，应先将单调队列队尾元素中 $d p$ 值小于 $d p [i]$ 的元素从队列中删除，再将下标 $i$ 存入单调队列；

代码

#include <cstdio>
#include <algorithm>
#define MAXN 100005
using namespace std;
int n, k;
long long a[MAXN], sum[MAXN], dp[MAXN][2];
int q[MAXN], head = 1, tail = 1; // 单调队列
int main() {
	scanf("%d %d", &n, &k);
	for (int i = 1; i <= n; i++) {
		scanf("%lld", &a[i]);
		sum[i] = sum[i - 1] + a[i]; // 计算前缀和
	}
	for (int i = 1; i <= n; i++) {
		dp[i][0] = max(dp[i - 1][0], dp[i - 1][1]); // 更新 DP
		while (head <= tail && q[head] < i - k)	head++; // 去除单调队列中已无效的状态
		dp[i][1] = dp[q[head]][0] - sum[q[head]] + sum[i]; // 更新 DP
		while (head <= tail && dp[q[tail]][0] - sum[q[tail]] < (dp[i][0] - sum[i])) tail--; //维持点调性
		q[++tail] = i; // 存入新状态
	}
	printf("%lld", max(dp[n][0], dp[n][1]));
	return 0;
}

总结

更为一般地，对于可以单调队列优化的状态转移式均可写为以下形式，
$dp[i] = \min_{j = L(i)}^{R(i)}\{dp[j] + val(i, j)\}$
此为动态规划的一类模型，被称为 1D/1D 的动态规划；

其中，

$L (i), R (i)$ 为关于 $i$ 的一次函数，且有 $\leq i$ ，限制了 $j$ 的决策范围，保证其上下界变化具有单调性；

$v a l (i, j)$ 为关于 $i, j$ 的多项式函数；

回顾上题，将 $v a l (i, j) = q (i) + p (j)$ 拆为了两个部分，一部分 $q (i)$ 仅与 $i$ 有关，另一部分 $p (j)$ 仅与 $j$ 有关，将 $q (i)$ 提出 ${ } \min_{j = L(i)}^{R(i)}\{\}$ 中，用单调队列维护 $d p [j] + p (j)$ 的值；

所以在上述 1D/1D 的动态规划中，多项式 $v a l (i, j)$ 是否能且仅能拆分为存在 $q (i), p (j)$ 两个部分是能否使用单调队列优化的基本条件；

即 $d p$ 状态转移方程形如 $dp[i] = \min_{j = L(i)}^{R(i)}\{dp[j] + q(i) + p(j)\}$ 可用单调队列优化；

三、斜率优化

说明

在 1D/1D 的动态规划中，多项式 $v a l (i, j)$ 若能拆分成 $q (i) + p (j) + a (i) * b (j)$ 即可以使用动态规划的斜率优化；

其中， $q (i), a (i)$ 仅与 $i$ 有关， $p (j), b (j)$ 仅与 $j$ 有关；

即 $d p$ 状态转移方程形如 $dp[i] = \min_{j = L(i)}^{R(i)}\{dp[j] + q(i) + p(j) + a(i) * b(j)\}$ 可用斜率优化；

即可继续方程式变形，
$\begin{aligned} dp[i] &= dp[j] + q(i) + p(j) + a(i) * b(j) \\ dp[j] + p(j) &= -a(i) * b(j) + dp[i] + q(i) \\ \end{aligned}$
变形为 $y = k x + b$ 的样式，其中 $d p [j] + p (j)$ 即为 $y$ ， $b (j)$ 即为 $x$ ， $- a (i)$ 即为 $k$ ， $d p [i] + q (i)$ 即为 $b$ ；

则平面直角坐标系的一个点 $(b (j), d p [j] + p (j))$ 仅与 $j$ 有关，整个 $d p$ 是一条直线，其斜率为 $- a (i)$ ，截距为 $d p [i] + q (i)$ ，由于要求 $d p [i]$ 最小，则应让一条过点 $(b (j), d p [j] + p (j))$ 的直线截距 $d p [i] + q (i)$ 最小；

由于在求解 $d p [i]$ 值时， $- a (i)$ 仅与 $i$ 有关，所以可以将其看作一个定值；

即求过点 $(b (j), d p [j] + p (j))$ 的斜率为 $- a (i)$ 的直线的截距 $d p [i] + q (i)$ 最小；

若图上的每个点均为一个 $j$ 所对应的点，直线为 $l$ ，则此时情况为，

斜率优化说明-C-1

则点 $C$ 即为 $d p [i]$ 对应的最优的 $d p [j]$ ；

则此时可以发现， $A, B, C$ 三个点共同组成了一个下凸包，即 $K_{l(A, C)} < K_{l(C, B)}$ ，则中间点 $C$ 即为最优解；

对于剩下的两个点，

对于 $A$ 点，由于斜率不断增大， $A$ 点不可能用来转移后面的状态，所以将它删除；
对于 $B$ 点，当斜率到达一定大小，例如下图，

斜率优化说明-B-2

此时最优解为 $B$ ，而 $C$ 又要删除；

所以只要维护一个下凸包，使得下凸包中相邻两个点连的斜率要大于当前这条线的斜率，正如上例；

可以使用单调队列维护，

一旦最左端的一个点和次左端的点的连线要小于当前的斜率了，就把最左端的点删除，每次遇到新的直线，直接拿最左端的点来转移；

加入一个新点 $i$ 就加到最右边，由于横坐标也是递增的，在加入点 $i$ 之前，一定要保证下凸的性质，先将 $i$ 点与单调队列队尾元素组成直线 $l_1$ 的斜率与单调队列队尾两个元素组成的直线 $l_2$ 的斜率相比较；

如下图所示，

斜率优化说明-队尾维护-3

若 $K_{l_1}$ 大于 $K_{l_2}$ ，则队尾元素一定不会成为最优解，则将队尾元素删除，再将下标 $i$ 存入单调队列；

注意，比较斜率时，为防止卡精度可十字相乘转化为乘积形式，但若分母为负数，应该要变号；

例题

玩具装箱

题目

有 $n$ 个数，每个数有一个值 $C_i$ ，将这 $n$ 个数分为若干段，对于一段 $\sim j$ ，其的费用为 $\sum_{k - i}^{j} C_k - L)^2$ ，求最小的总费用；

分析

状态

$d p [i]$ 表示前 $i$ 个数总费用的最小值；

转移

通过题目费用计算方法可知状态转移方程为，
$dp[i] = \min_{j = 1}^{i - 1}\{dp[j] + (i - j - 1 + sum[i] − sum[j] − L)^2\}$

优化

先转化状态转移方程，
$\begin{aligned} dp[i] & = dp[j] + (i - j - 1 + sum[i] − sum[j] − L)^2 \\ dp[i] & = dp[j] + ((i - sum[i]) - (sum[j] + j − L - 1))^2 \\ \end{aligned}$
为方便表示，令 $A [i] = i + s u m [i], B [j] = j + s u m [j] - L - 1$ ，即
$\begin{aligned} dp[i] & = dp[j] + (A[i] - B[j])^2 \\ dp[i] & = dp[j] + A[i]^2 + B[j]^2 - 2 * A[i] * B[j] \\ dp[j] + B[j]^2 &= 2 * A[i] * B[j] + dp[i] - A[i]^2 \end{aligned}$
其中 $dp[j] + B[j]^2$ 即为 $y$ ， $2 * A [i]$ 即为 $k$ ， $B [j]$ 即为 $x$ ， $dp[i] + A[i]^2$ 即为 $b$ ；

即求过 $B[j], dp[j] + B[j]^2)$ ，斜率为 $2 * A [i]$ 的直线的截距的最小值；

即可通过单调队列维护一个下凸包；

先预处理出 $A, B, s u m$ 数组；

再依次遍历每一个数，

先将队头两个点组成直线的斜率与 $2 * A [i]$ 比较，若队头两个点组成直线的斜率比 $2 * A [i]$ 小，则不能去，将其从对头删除；

用单调队列的队首元素更新 $d p [i]$ 的值；

将下标 $i$ 存入单调队列中，但为维护下凸包斜率的单调性，先将 $i$ 点与单调队列队尾元素组成直线 $l_1$ 的斜率与单调队列队尾两个元素组成的直线 $l_2$ 的斜率相比较；

$K_{l_1}$ 应大于 $K_{l_2}$ ，否则则 $i$ 一定不会成为最优解则将队尾元素删除，再将下标 $i$ 存入单调队列；

代码

#include <cstdio>
#include <algorithm>
#define MAXN 500005
using namespace std;
int n;
long long l, c[MAXN], sum[MAXN], dp[MAXN], a[MAXN], b[MAXN];
int head, tail, q[MAXN];
long long get_up(int x, int y) { // y 坐标差值
	return dp[x] + b[x] * b[x] - dp[y] - b[y] * b[y];
}
long long get_down(int x, int y) { // x 坐标差值
	return b[x] - b[y];
}
long long get_dp(int i, int j) { // 获取 dp 值
	return dp[j] + (a[i] - b[j]) * (a[i] - b[j]);
}
int main() {
	scanf("%d %lld", &n, &l);
	for (int i = 1; i <= n; i++) {
		scanf("%lld", &c[i]);
		sum[i] = sum[i - 1] + c[i]; // 预处理
		a[i] = sum[i] + i;
		b[i] = sum[i] + i + l + 1;
	}
	b[0] = l + 1;
	head = tail = 1; // 清空队列
	for (int i = 1; i <= n; i++) {
		while (head < tail && get_up(q[head + 1], q[head]) < 2 * a[i] * get_down(q[head + 1], q[head])) head++; // 通过斜率维护下凸
		dp[i] = get_dp(i, q[head]); // 更新 DP 值
		while (head < tail && get_up(i, q[tail]) * get_down(q[tail], q[tail - 1]) < get_down(i, q[tail]) * get_up(q[tail], q[tail - 1])) tail--; // 维护将 i 节点加入队列后的下凸
		q[++tail] = i; // 存入新的节点
	}
	printf("%lld\n", dp[n]);
	return 0;
}