HNOI 2008 玩具装箱 (BZOJ 1010)进一步学习 →.→ DP 单调性优化

再一次接触单调性优化DP,比上一次好一点,但还是很吃力,需要多加练习。
这道题有不同程度的优化,也被作为很多课件里例题讲解DP的优化的,再加上这道题很简单,所以就选择这道题来理解一下斜率优化。

状态以及转移很容易想出:f[i]表示前i个玩具装箱的最小代价,f[i] = min{f[j] + w(j+1, i)}。但是裸DP是O(n^2)的复杂度,5w的数据范围是过不了的。在状态上已经很难再变化了,我们考虑转移过程中的优化。

首先可以用四边形不等式证明(我是不会说,我是先写的O(n^2)打表后发现的,因为并不理解四边形不等式)决策的单调性,即设fa[i]表示f[i]是由f[fa[i]]转移,对于每个i < j, 都有fa[i] < fa[j]。

证明了决策单调性,那么最次的优化,就是从上一个状态的决策点开始枚举此次决策。这个做法还是挺冒险的,O(n) ~ O(n^2)的复杂度,虽然能AC。

既然我们知道决策单调性,可以实质性地减少枚举量。对于当前已经计算出来的f[i],假设它可以优化f[j](i < j),即fa[j] == i,那么对于j以及j之后,都没有必要去考虑1~i-1的决策了。也就是说,每时每刻我们可以将i+1~n计算出当前时刻最优解,或者是说,由f[1]~f[i]转移得来的最优解。那么我们每计算出一个f[i],需要做的就是找到第一个j,满足由i转移到j比之前1~i-1的决策中转移到j更优,可以使用二分。由于满足决策单调性,那么j+1~n也是由i转移更优。我们可以使用线段树来保存决策,因为每时每刻i+1~n的决策是成段的,使用线段树区间修改。这样可以优化到O(nlog^2n)。不过也可以使用栈来储存,这样就是O(nlogn),需要细想一下。

但是这样还不够快,最理想的复杂度是线性的,而斜率优化就可以做到这一点。借此先写一下自己对斜率优化的理解:

/*************************
DP优化详解参见:1D1D动态规划优化初步
斜率优化,就是把状态转移方程变形,形象地把决策看成点,有x,y坐标,画在坐标轴上,而我们要求的当前状态作为一条直线的纵截距,此直线斜率已知(斜率常常由当前状态决定,而坐标必须由决策决定,所以斜率优化是有前提的,而且坐标是不能乱选的)。那么最优的答案,以最小值为例,就可以把这条斜率固定的直线从负无穷向上移动,碰到的第一个点就是最优决策,此时直线的截距是最小的。

要理解斜率优化,画图是最好的,画出坐标系,上面有代表决策的点,随着时间推移,肯定会有一些点不够后来的优而被舍弃,就像单调队列一样。由于我们要找的是使直线截距最小或最大的点,所以这个点肯定是所有点围成的多边形的一个顶点,这个多边形肯定是凸多边形,内部的点就会被舍去,这个根据数学知识可知,或画画图,移动一下直线就很容易证明。

那么如何找这个点(决策),根据单调性会有很多种情况,这道题的情况是最简单的情况,它代表决策的点的横坐标和当前状态的斜率都满足单调性(或许还有更简单的斜率不变的),这就很容易处理。

目前我也才是理解到了这里:决策直线的斜率与二元组的横坐标同时满足单调性。这时我们可以用单调队列来维护这个凸壳(凸多边形)。
而当斜率和横坐标没有限制时,用到SPLAY维护凸壳。
*************************/

对于这道题,用单调队列维护凸壳,每次决策时作这样几件事:
1. 决策指针(队首)后移,直至最佳决策点。
2. 进行决策。
3. 将进行决策之后的新状态的二元组加入队尾,维护凸壳。

说了这么多,我们没说清楚斜率和坐标是由什么决定的,先把转移方程变形:f[i] = min{f[j] + w(j+1, i)} = min{f[j] + (sum[i] - sum[j] + i - j - 1 - L)^2}。
看起来很多,我们在输入数据时令L++, s[i] = sum[i]+i。
就是f[i] = min{f[j]+(s[i]-s[j]-L)^2}。可以多试一试不同的拆分方式,最后找出合适的代表x,y以及k的量。

令x = s[j], y = f[j]+s[j]^2, k = 2*(s[i]-L),b = f[i]。于是就有了每一条直线y = kx+b。对于当前状态i,我们可以确定斜率k,需要在由决策点组成的凸壳中选出一个最优的点(x,y)使截距最小,下面依次解释上面的三个步骤:
1. 斜率是单调变化的,所以队首的元素有可能不是最优的,我们就需要弹出不是最优的队首,队首是最优的。(就是不断拿队首和队列第二个元素比较)
2. 计算
3. 此步骤可以说是最重要的,维护凸壳,如果当前决策点加入到坐标系中与上一个点相连会变成一个凹四边形,那么就是说上一个点不如当前点优,将他弹出。
这些步骤画出图就很容易理解了。

#include <cstdio>
#include <algorithm>
#include <cstring>
#define M 50005
typedef long long L;
using namespace std;

L n, l, s[M], y[M], f[M];
L q[M], h, t;

L sqr(L x){
    return x*x;
}

int main()
{
    scanf("%lld %lld", &n, &l);
    l++;
    for(int i = 1; i <= n; i++){
        scanf("%lld", s+i);
        s[i] += s[i-1] + 1;
    }

    for(int i = 1; i <= n; i++){
        int x = s[i] - l;
        while(h < t && y[q[h]]-2*x*s[q[h]] > y[q[h+1]]-2*x*s[q[h+1]]) h++;
        f[i] = f[q[h]] + sqr(x-s[q[h]]);
        y[i] = f[i] + sqr(s[i]);
        while(h < t && (y[q[t]]-y[i])*(s[q[t-1]]-s[i]) < (y[q[t-1]]-y[i])*(s[q[t]]-s[i])) t--;
        q[++t] = i;
    }
    printf("%lld", f[n]);
    return 0;
}
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值