Codeforces 167B 状态设置的优化

题意:

一名参赛者有一个能装下 k k k份奖金的袋子。有 n n n场比赛,每场比赛中的胜者会被奖励一个大小为 a i a_{i} ai的袋子或者是一份奖金。当参赛者赢得至少 l l l场比赛会被认为是发挥良好。参赛者每次赢的一场比赛后赢的得奖金不必立刻放入他的背包,它可以完成所有比赛后带着所有背包回来装奖金,每场比赛获胜的概率是 p [ i ] p[i] p[i],问最后发挥良好并且能够带走他赢下的所有奖金的概率是多少?

方法:

显然是一个 d p dp dp

一开始的思路,设 d p [ i ] [ j ] [ k ] dp[i][j][k] dp[i][j][k]为前 i i i场,赢了 j j j场,并且此时总容量为 k k k的概率是多少。注意到最多装下 n n n份奖金,于是 k > = n + 1 k>=n+1 k>=n+1的部分选择累加在 d p [ i ] [ j ] [ n + 1 ] dp[i][j][n+1] dp[i][j][n+1]上。最后的答案应该是所有 ∑ j = l n ∑ k = 赢下的奖金场数 n + 1 d p [ n ] [ j ] [ k ] \sum_{j=l}^{n} \sum_{k=赢下的奖金场数}^{n+1}dp[n][j][k] j=lnk=赢下的奖金场数n+1dp[n][j][k]

我们维护的状态并不能反映赢下的奖金场数这一个概念,于是考虑这样写状态:

d p [ i ] [ j ] [ k ] [ l ] dp[i][j][k][l] dp[i][j][k][l]为前 i i i场,赢了 j j j场奖金场, k k k场背包场,容量为 l l l,最后答案为 d p [ n ] [ j ] [ k ] [ l ] ( l ≥ i ) dp[n][j][k][l](l\geq i) dp[n][j][k][l](li)之和,这样时间复杂度和空间复杂度都是 O ( n 4 ) O(n^4) O(n4)的,空间可以滚动压缩成 O ( n 3 ) O(n^3) O(n3),可惜时间复杂度不能优化了。

正解思路是这样,设 d p [ i ] [ j ] [ k ] dp[i][j][k] dp[i][j][k]为前 i i i场,赢了 j j j场,此时容量剩余 k k k,这样每次我们赢了一场奖金场,我们就可以在 k k k上体现出来,由于 k k k可能为负数,那么我们需要加上一个偏移量 m a x n = 200 maxn=200 maxn=200,这样时间复杂度也为 O ( n 3 ) O(n^3) O(n3)

at all,设置状态可以选择设两个相互联系的变量来代替三个具体的变量,但并非是无用设置,无用设置比如说将 i i i n − i n-i ni设为两个状态,这显然是没必要的。

#include<bits/stdc++.h>
#define ll long long
using namespace std;

int n,l,kk,a[205];
double p[205],dp[205][205][405];

int main()
{
    cin>>n>>l>>kk; //一开始的只能装下k
    kk=min(kk,n);
    for(int i=1;i<=n;i++)
    {
        int tmp; cin>>tmp;
        p[i]=tmp*0.01;
    }
    for(int i=1;i<=n;i++) cin>>a[i];
    //最后表现良好,并且赢的奖品每次都有机会
    //dp[i][j][k] -> 前i场赢了j场。剩余空间为k
    dp[0][0][kk+200]=1;
    for(int i=0;i<n;i++)
    {
        for(int j=0;j<=i;j++)
        {
            for(int k=0;k<=401;k++)
            {
                if(a[i+1]==-1)
                {
                    if(k>=1) dp[i+1][j+1][k-1]+=dp[i][j][k]*p[i+1];
                    dp[i+1][j][k]+=dp[i][j][k]*(1-p[i+1]);
                }
                else
                {
                    dp[i+1][j+1][min(401,k+a[i+1])]+=dp[i][j][k]*p[i+1];
                    dp[i+1][j][k]+=dp[i][j][k]*(1-p[i+1]);
                }
            }
        }
    }
    double ans=0;
    for(int i=l;i<=n;i++)
        for(int j=200;j<=401;j++) ans+=dp[n][i][j];
    printf("%.10lf",ans);
    return 0;
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值