斜率优化学习笔记

最新推荐文章于 2021-03-08 15:48:59 发布

置顶 ZXfoil

最新推荐文章于 2021-03-08 15:48:59 发布

阅读量260

点赞数

分类专栏： DP 斜率优化

DP 同时被 2 个专栏收录

8 篇文章 0 订阅

订阅专栏

斜率优化

3 篇文章 0 订阅

订阅专栏

斜率优化学习笔记
发现自己傻傻分不清斜率优化和决策单调性→_→，被一些博客误导了。。于是总结一下。萌新们可以先写写[hnoi2008]玩具装箱，并不难。

数

相信有心想学习斜率优化的同志们一定自己摸索着写过[hnoi2008]玩具装箱这道题吧，我刚开始学习斜率优化的时候，也是写了这个，然后似懂非懂的发现，好像斜率优化就是先证明决策单调性，然后再用单调队列维护一下什么的，这不就是套个模板的东西吗→_→。

对于某一类型的dp方程 $f [i] = M i n (a [i] * b [j] + c [j] + d [i])$

其中 $a [x], b [x], c [x], d [x]$ 是关于x的函数，且b单增。——————【1】

按照一贯的套路，先数学归纳法证明决策单调性。

1.归纳假设：

假设有i前两个决策点 $j, k (j < k)$ ，且 $k$ 的决策要比 $j$ 好，即：
　　　 $a [i] * b [j] + c [j] + d [i] > = a [i] * b [k] + c [k] + d [i] ， j < k$ ——————【2】

2.归纳推理：

此时后面有状态i+1，这里我们为了简单起见，不妨设 $a [i + 1] = a [i] - v, v > 0$ ，也就是 $a$ 单调递减。
即证： $a [i + 1] * b [j] + c [j] + d [i + 1] > = a [i + 1] * b [k] + c [k] + d [i + 1]$

$(a [i] - v) * b [j] + c [j] + d [i + 1] > = (a [i] - v) * b [k] + c [k] + d [i + 1]$

化简得： $a [i] * b [j] + v * b [k] + c [j] > = a [i] * b [k] + v * b [j] + c [k]$

由【2】得： $a [i] * b [j] + c [j] > = a [i] * b [k] + c [k]$
由【1】得： $b [k] > b [j]$
又 $∵ v > 0$
$∴ v * b [k] > = v * b [j]$
得证
　　所以，决策单调性是存在的。我们将由决策单调性得出的式子展开，化成斜率式：

$a [i] * b [j] + c [j] + d [i] > = a [i] * b [k] + c [k] + d [i] ， j < k$

$−a[i]>=\cfrac{c[k]−c[j]}{b[k]−b[j]}$

记斜率
$slope(i,j)=\cfrac{c[k]−c[j]}{b[k]−b[j]}$

然后发现这个东西很符合单调队列的尿性：

$- a [i] > = s l o p e (q [l], q [l + 1])$ 。因为 $q [l]$ 在 $q [l + 1]$ 之前加入，那么显然这个式子就表示 $q [l]$ 决策不如 $q [l + 1]$ 优，我们可以将队首pop掉。
$s l o p e (q [r - 1], q [r]) > s l o p e (q [r], i)$ 。假设我们在后面存在一个 $a [t]$ 使得 $- a [t] > = s l o p e (q [r - 1], q [r])$ 那么等到pop了 $q [r - 1]$ 之后， $- a [t]$ 一定也会>= $s l o p e (q [r], i)$ ， $q [r]$ 也会被pop。所以说 $q [r]$ 实际上是无用的，我们可以直接将它pop掉。
　　问题就这样优化到了 $O (n)$ 。

回顾一下我们之所以可以使用斜率优化，是因为这个dp方程具有决策单调性；否则我们推不出斜率式。之后我们将决策单调性的式子变形为斜率式，当满足斜率式的时候就表明前一个决策不如后一个决策优，一切都是围绕着决策单调性开展的，可以说决策单调性是斜率优化的前提。（那是真的么，欲知后事，请看下文）

现在我们换一个角度来考虑问题，刚刚是直接从”数“的角度进行了严谨的证明，那么我们现在从”形“的角度来意会。

形

dp方程：
$f [i] = M i n (a [i] * b [j] + c [j] + d [i])$ ，b[j]单增

我们这里沿用上面“数”的条件：a单减，b单增。

移项：
$- a [i] * b [j] + f [i] = c [j] + d [i]$

是不是很像直线的斜截式： $- a [i]$ 为直线的斜率；直线过点： $(b [j], c [j] + d [i])$ ； $f [i]$ 即为直线在Y轴上的截距。

这里写图片描述
　　
　　可以看出，因为 $f [i]$ 要尽可能小，所以我们把之前小于 $i$ 的 $j$ 画在平面直角坐标系上，一如线性规划，把这条斜线自下往上平移时遇到的第一个点，即能使目前状态有最小值的点。于是我们需要维护一个下凸壳，把那些肯定不会贡献的点删掉。

这里写图片描述

我们用一个单调队列维护这个凸壳，因为要保证凸壳的下凸性，所以我们显然可以得到单调队列pop队尾的条件： $s l o p e (q [r - 1], q [r]) > s l o p e (q [r], i)$ 。

考虑什么情况下pop队首元素（这里我们的讨论都是基于 $f [i]$ 取最小值的情况下的）：

斜率 $- a [i]$ 单增（因为 $a$ 单减）。 $- a [i] > s l o p e (q [l], q [l + 1])$ 。
斜率不单调。无法pop队首，二分或者三分查找队列中的最优解。二分做法：假设你要在上凸包上二分找斜率为k的切线。取中间的 $m i d$ 号点，如果 $m i d + 1$ 存在且与 $m i d$ 点的斜率小于 $k$ ，则 $l = m i d + 1$ ；如果 $m i d - 1$ 存在且与 $m i d$ 点的斜率大于 $k$ ，则 $r = m i d - 1$ ；如果上面两条都不满足，则 $m i d$ 就是切点。
　　不错，你一定已经发现第一种情况所对应的维护方式不是跟之前所说“数”的单调队列维护方式一模一样吗，没错，其实这只是两种不同的解题方式所得出来的同样的结果。