浅谈WQS二分、带权二分、凸优化与一类斜率优化DP

最新推荐文章于 2023-11-29 10:41:39 发布

ixRic

最新推荐文章于 2023-11-29 10:41:39 发布

阅读量1k

点赞数 9

分类专栏： # WQS 二分 # 斜率优化 DP 文章标签：二分 WQS二分算法 DP 斜率优化

本文链接：https://blog.csdn.net/C20190102/article/details/102911433

版权

WQS 二分同时被 2 个专栏收录

2 篇文章 0 订阅

订阅专栏

斜率优化 DP

1 篇文章 0 订阅

订阅专栏

除最后一张普适公式外，文中所有图像和公式均为原创，转载请附出处谢谢！！！

题意

[BZOJ 4518] Sdoi2016 征途
求 $n$ 个数 $a_1,a_2,\cdots,a_n$ 分成 $m$ 段，求每段的数之和的方差 $s^2$ 的最小值，输出 $s^2\times m^2$ 。
（ $1\leq n\leq2\times10^5$ ， $1\leq m\leq n$ ， $\sum\limits_{i=1}^{n}a_i\leq3\times10^4$ ，实际上数据可以开成这样）

一个简单的转化

设第 $i$ 段数之和是 $p_i$ ，众所周知方差 $s^2=\dfrac{\sum\limits_{i=1}^{m}(p_i-\overline{p})^2}{m}$ ，其中 $\overline{p}=\dfrac{\sum\limits_{i=1}^{m}p_i}{m}=\dfrac{\sum\limits_{i=1}^{n}a_i}{m}$ 。
所以 $\begin{aligned} s^2\times m^2&=m\left(\sum\limits_{i=1}^{m}(p_i-\overline{p})^2\right)\\ &=m\left(\sum\limits_{i=1}^{m}{p_i}^2-2\times\overline{p}\times\sum\limits_{i=1}^{m}p_i+m\times\overline{p}^2\right)\\ &=m\sum\limits_{i=1}^{m}{p_i}^2-2\times\left(\sum\limits_{i=1}^{n}a_i\right)^2+\left(\sum\limits_{i=1}^{n}a_i\right)^2\\ &=m\sum\limits_{i=1}^{m}{p_i}^2-\left(\sum\limits_{i=1}^{n}a_i\right)^2 \end{aligned}$
发现 $\left(\sum\limits_{i=1}^{n}a_i\right)^2$ 是定值，所以要求的就是 $m\sum\limits_{i=1}^{m}{p_i}^2$ 的最小值。

二维DP

（不考虑时空问题）
$m$ 也是定值，所以只需要求 $\sum\limits_{i=1}^{m}{p_i}^2$ 的最小值。

朴素

先处理前缀和 $S_i$ ，一个直观的思路是 $d p [i] [j]$ 表示前 $i$ 个数，分成 $j$ 段，的平方和的最小值。那么这个 $O(n^3)$ 的DP就超级简单： $dp[i][j]=\min\{dp[k][j-1]+(S_i-S_k)^2\}$

斜率优化

机智的人会发现这个是个斜率优化的板子（我们等会进行理解）可以优化到 $O(n^2)$ ，虽然可以再滚动一维数组，但是时间还是过不了。

带权二分

众所周知，带权二分，又叫wqs二分，凸优化等。它的应用范围很脑残：一般是让你在一堆元素当中恰好选 $x$ 个/分 $x$ 段，以达成某个条件。

我们先看一道简单题

题意

[BZOJ 2654] tree

给你一个无向带权连通图，每条边是黑色或白色。让你求一棵最小权的恰好有 $\text{need}$ 条白色边的生成树。

分析

可能你会考虑到用破圈法换边，但是这个的正确性是fake的。~~或许你能骗到几十分~~。下面是这个方法的解释：

先用黑边做一个最小生成树，然后从小到大依次加入白边，每加入一条就用破圈法找到这个圈里面最大权的黑边，替换。
反例：（红色的是白边）， $\text{need}=1$

我们给每个白边的权加 $w$ （ $w$ 可以是负数），再直接做最小生成树，可以得到一个白边的数量 $x$ ，很显然 $w$ 跟 $x$ 成反相关，也就是说： $w$ 越大，选的白边越少。

于是二分 $w$ 即可。

这就是最基本的带权二分。

对了这道题可以先把黑边和白边分别排序，check的时候用Kruskal归并排序，时间复杂度少一个 $\log n$ 。

代码

我没有写归并，而且很丑。

#include<bits/stdc++.h>
using namespace std;

int read(){
    int x=0;bool f=0;char c=getchar();
    while(c<'0'||c>'9') f|=c=='-',c=getchar();
    while(c>='0'&&c<='9') x=x*10+(c^48),c=getchar();
    return f?-x:x;
}

#define MAXN 50000
#define MAXM 100000
int N,M,Need;
struct Edge{
    int u,v,w,c;
}E[MAXM+5];

bool cmp(Edge i,Edge j){
    return i.w<j.w;
}

int fa[MAXN+5];
int Find(int x){
    return fa[x]==x?x:fa[x]=Find(fa[x]);
}

int Ans;
bool Check(int Add){
    for(int i=1;i<=M;i++)
        if(!E[i].c)
            E[i].w+=Add;
    for(int i=0;i<=N;i++)
        fa[i]=i;
    sort(E+1,E+M+1,cmp);
    int cnt=0;Ans=0;
    for(int i=1;i<=M;i++){
        int x=Find(E[i].u),y=Find(E[i].v);
        if(x!=y){
            if(!E[i].c)
                cnt++,Ans-=Add;
            fa[x]=y;
            Ans+=E[i].w;
        }
    }
    for(int i=1;i<=M;i++)
        if(!E[i].c)
            E[i].w-=Add;
    return cnt<Need;
}

int main(){
    N=read(),M=read(),Need=read();
    for(int i=1;i<=M;i++)
        E[i].u=read(),E[i].v=read(),E[i].w=read(),E[i].c=read();
    int Left=-MAXN,Right=MAXN;
    while(Left+1<Right){
        int mid=(Left+Right)>>1;
        if(Check(mid))
            Right=mid;
        else
            Left=mid;
    }
    Check(Left);
    printf("%d",Ans);
}

进入正题

题目回顾

我们通过一个简单的转化，将原问题变成了求 $m\sum\limits_{i=1}^{m}{p_i}^2$ 的最小值。

分析

同样的我们想办法给某个东西加一个权。

加权

好了，就是给每段的平方（ ${p_i}^2$ ）加一个权 $c$ 。

像上一道题一样，这个时候的段数已经不重要了。所以我们求的是，分的段数没有限制的情况下（我们现在令这个段数为 $x$ ） $\sum\limits_{i=1}^{x}\left({p_i}^2+c\right)$ 的最小值，如果在这个最小值的状态下 $x$ 恰好等于 $m$ ，原问题就解决了（时刻记住，取得最小值是先决条件）。

权与段数的关系

单调性

然后我们来感性理解一下这个段数 $x$ 和权值 $c$ 的关系，以确定能否二分，令：
$\begin{aligned} f(x)&=\min\{\sum\limits_{i=1}^{x}{p_i}^2\}\\ g(c)&=\min\{\sum\limits_{i=1}^{x}\left({p_i}^2+c\right)\}=\min\{f(x)+x\cdot c\} \end{aligned}$

容易发现的是， $f (x)$ 单减（分的段数越多，代价越小）：
y=f(x)
随便找个 $x_0$ ：
随便找个x0
那么 $f(x_0)+x_0\cdot c$ 长这样（ $\tan\theta=c$ ）：
f(x0)+x0c
$g (c)$ 显然就是斜率为 $- c$ 的直线（下图中的红线）与 $f (x)$ 的切线的截距：

所以我们的忘情水二分实际上是二分的斜率，求切点的横坐标，使切点的横坐标逼近 $m$ ！
你可能会问，为什么不直接求 $f (m)$ ，要是能求就不需要忘情水了啊！（其实可以求，就是最开始的那个二维DP+斜率优化，只是会超时）。
或者说，忘情水直接灭掉了DP的“cnt”那一维！

其实上面那些没什么用，你只需要很明显地发现由于 $f (x)$ 单减， $g (x)$ 和 $c$ 正相关即可：

两个问题

那么，在 $c$ 为整数的范围内，到底能不能二分出一个 $x$ 恰好等于 $m$ 呢？
这个时候就不能考虑连续函数了，因为 $f (x)$ （它本身就）是离散的（所以上面这些图都不严谨）：
f(x)
注意到 $f (x)$ 的定义域和值域都是 $\Z$ ，相邻点的横坐标之差都是 $1$ ，这说明了， $f (x)$ 的任意一条切线的斜率（上图中的 $t$ ）肯定是整数！于是我们一定可以二分到一个整数斜率！

但是还有一个问题：

图中 $A, B, C$ 三点共线，当你二分到 $k_{l_{AC}}$ 时，到底哪个横坐标算最终的 $x$ ？事实上，三个都可以，也就是说 $x_A,x_b$ 或 $x_c=m$ ，这个斜率都是对的！但这个返回什么其实不影响，因为你不输出方案，二分最终的 $L e f t$ 和 $R i g h t$ 最后肯定在 $A C$ 以内，但不一定是 $m$ （因写法而不同）， $A, B, C$ 三个点对应的答案肯定是对的（答案仅与 $g (c)$ 和最开始那个简单的转换里面的常数有关，而 $A, B, C$ 三点 $g (c)$ 都一样），但是输出方案就会有问题，因为（就这道题来说） $x_A\neq x_C\neq x_C$ （还记得 $x$ 实际意义是什么吗，分成的段数！）。

上面这段话只是在解释这个算法的正确性，如果不能看懂也无妨，毕竟是细节问题，当然欢迎提问。

DP

朴素DP

熟练地写出求 $\sum\limits_{i=1}^{x}\left({p_i}^2+c\right)$ 最小值的DP式子（ $S_i$ 还是前缀和） $dp[i]=\min\{dp[j]+(S_i-S_j)^2+c\}$ 这个显然是 $O(n^2)$ ，总的复杂度是 $O(n^2\log S_n)$ ~~，以原题的数据范围是过得了的。~~

斜率优化

就题论题的分析方法

鉴于我还没有讲过斜率优化，这里将会详细讲解一下，从入门开始。

假设对于某个 $d p [i]$ ，有从 $j_1$ 转移比从 $j_2$ 转移过来更优，那么： $dp[j_1]+(S_i-S_{j_1})^2+c<dp[j_2]+(S_i-S_{j_2})^2+c$ $dp[j_1]-dp[j_2]<(S_i-S_{j_2})^2-(S_i-S_{j_1})^2$ $dp[j_1]-dp[j_2]<(2S_i-S_{j_2}-S_{j_1})(S_{j_1}-S_{j_2})$ 然后，不等式移项，先看正负，所以我们先讨论 $S_{j_1}<S_{j_2}$ （原因一会再说），移项变号： $\dfrac{dp[j_1]-dp[j_2]}{S_{j_1}-S_{j_2}}>2S_i-S_{j_2}-S_{j_1}$ $\dfrac{dp[j_1]-dp[j_2]+(S_{j_1}-S_{j_2})(S_{j_2}+S_{j_1})}{S_{j_1}-S_{j_2}}>2S_i$ $\dfrac{(dp[j_1]+{S_{j_1}}^2)-(dp[j_2]+{S_{j_2}}^2)}{S_{j_1}-S_{j_2}}>2S_i$

这个很像斜率式对吧，所以对于一个 $j$ ，我们把它做成一个点 $P_j\left(S_j,dp[j]+{S_j}^2\right)$ ，左边就是直线 $P_{j_1}P_{j_2}$ 的斜率，再做一条斜率为 $2S_i$ 的直线 $l$ ，它们就是这个样子的（ $k_{P_{j_1}P_{j_2}}>k_l$ ， $S_{j_1}<S_{j_2}$ ）：

显然 $S_j$ 是单调增的，那么，由于DP是从小到大枚举下标的，那么我们用当前这个 $d p [i]$ 维护这个“凸包”（为什么叫这个名字你一会就知道了）时， $P_i$ 也是从左到右加进去的（这就是为什么要讨论 $S_{j_1}<S_{j_2}$ 而不讨论另一种）。于是这个图像有这两种情况：

情况一
由于 $2S_i$ 也是单调，那么 $l$ 接下来会逆时针转成这样：

或这样：

比较这三种情况中三条线的斜率，可以得到 $j_2$ 完全没有用，所以我们删掉 $j_2$ ，变成这样：
情况二

由于 $2S_i$ 也是单调，那么 $l$ 接下来会逆时针转成这样：

同情况一，还有这样：

比较这些情况中三条线的斜率，可以得到 $j_2$ 是有用的，所以要保留 $j_2$ 。

于是，想象一下，很多的 $j$ 到了一起，变成了这样：

我们形象地把它称为下凸包。

梳理一下，我们现在有一个这样的下凸包，要得到 $d p [i]$ 。

由于 $i$ 往后移了一位，所以 $2S_i$ 会变大， $l$ 会逆时针转一点，就可能导致凸包开头的某些斜率太小的线段不合法，例如下图中红色的 $P_{j_1},P_{j_2}$ 就该被删掉（红色线段斜率比 $l$ 小了），因为从这时开始，随着 $l$ 不断逆时针转，它们一辈子都不能比 $P_{j_3}$ 更优了：
让两个点去世
处理掉不合法的点过后，再看剩下的点，比较一下斜率可得 $P_{j_3}$ 优于 $P_{j_4}$ 优于 $P_{j_5}$ （实际上很明显的是越靠左越优，因为斜率是递增的，并且都比 $k_l$ 大）。

所以， $d p [i]$ 直接从 $dp[j_3]$ 转移来即可。

然后，将 $i$ 按照上面的维护下凸包的方法加入到最后（右端）即可。

一个普适的结论

Tip： $T(j_1,j_2)$ 是下面这个式子里左边那坨， $g (i)$ 就是右边那坨。
$\dfrac{(dp[j_1]+{S_{j_1}}^2)-(dp[j_2]+{S_{j_2}}^2)}{S_{j_1}-S_{j_2}}>2S_i$

（来自课件，侵删）（其实这个没有什么用，现推还能保证准确性）

代码

更多细节一定要看代码，虽然比较丑（#define int long long是被逼迫的！）

#include<cstdio>
#include<cstring>
#include<climits>
#include<algorithm>
using namespace std;


int read(){
    int x=0;bool f=0;char c=getchar();
    while(c<'0'||c>'9') f|=c=='-',c=getchar();
    while(c>='0'&&c<='9') x=x*10+(c^48),c=getchar();
    return f?-x:x;
}

#define MAXN 3000
#define int long long
#define LL long long
#define INF (1ll<<30)
int N,M;
LL Sum[MAXN+5];

LL dp[MAXN+5];
int cnt[MAXN+5];
LL X(int i){return Sum[i];}
LL Y(int i){return dp[i]+Sum[i]*Sum[i];}
LL DeltaX(int j1,int j2){return X(j2)-X(j1);}
LL DeltaY(int j1,int j2){return Y(j2)-Y(j1);}
double Slope(int j1,int j2){return 1.0*DeltaY(j1,j2)/DeltaX(j1,j2);}

#define Size (Tail-Head)
int Q[MAXN+5];
pair<LL,int> Check(LL w){
    int Head=1,Tail=1;
    dp[0]=cnt[0]=0;
    memset(dp,0,sizeof(dp));
    memset(cnt,0,sizeof(cnt));
    Q[Tail++]=0;
    for(int i=1;i<=N;i++){
        double Slopei=2*Sum[i];
        while(Size>=2&&Slope(Q[Head],Q[Head+1])<Slopei)
            Head++;
        int j=Q[Head];//删掉队首不合法的
        cnt[i]=cnt[j]+1;
        dp[i]=dp[j]+(Sum[i]-Sum[j])*(Sum[i]-Sum[j])+w;
        while(Size>=2&&Slope(i,Q[Tail-1])<Slope(Q[Tail-1],Q[Tail-2]))
            Tail--;
        Q[Tail++]=i;//加入i进去
    }
    return make_pair(dp[N],cnt[N]);
    //前面说的“两个问题”中的第二个，反映在这里是cnt[N]可能有多个值，但dp[N]只有一个值
}

signed main(){
    N=read(),M=read();
    for(int i=1;i<=N;i++)
        Sum[i]=Sum[i-1]+read();
    LL Left=-1,Right=INF;
    while(Left+1<Right){
        LL mid=(Left+Right)>>1;
        if(Check(mid).second<=M)
            Right=mid;
        else
            Left=mid;
    }
    printf("%lld",(Check(Right).first-M*Right)*M-Sum[N]*Sum[N]);
}

后记

这篇文章是我呕心沥血制作，经超级大神犇cxh的细心指导后（他真的很强！！！）完成（这个是他关于这个问题的博客，他最后关于二分细节的探讨我没有写，可以参考！）。有问题一定要提出！！！

ixRic

关注

9
点赞
踩
5

收藏

觉得还不错? 一键收藏
2
评论
浅谈WQS二分、带权二分、凸优化与一类斜率优化DP

幕天题意一个简单的转化二维DP朴素斜率优化带权二分我们先看一道简单题题意分析代码进入正题题目回顾分析加权权与段数的关系单调性两个问题DP朴素DP斜率优化就题论题的分析方法一个普适的结论代码后记除最后一张普适公式外，文中所有图像和公式均为原创，转载请附出处谢谢！！！题意[BZOJ 4518] Sdoi2016 征途求nnn个数a1,a2,⋯ ,ana_1,a_2,\cdots,a_na1,...
复制链接

扫一扫