NOIP 2018 Simulation Day 3 v题解

该博客介绍了如何使用动态规划和记忆化搜索策略解决一个概率问题:在给定数量的黑白球中,通过随机选择并移除球来最大化移除白球的期望数量。博主首先提出了朴素的动态规划方法,但由于时间复杂度过高导致超时。然后,他们通过优化状态表示,避免重复状态,并采用混合数组和映射的数据结构来提高效率。最终,通过调整状态数组,消除了第一维,解决了最后一个点可能超时的问题,实现了在3秒时限内快速求解的代码。
摘要由CSDN通过智能技术生成

题目描述

n n n个球排成一行,每个球的颜色为黑或白。执行 k k k次操作,第 i i i次操作形式如下:

1.从 [ 1 , n − i + 1 ] [1,n-i+1] [1,ni+1]中,等概率随机选择一个整数 x x x

2.移除从左到右的第 x x x个球,或从右到左的第 x x x个球(也就是从左到右的第 n − i + 2 − x n-i+2-x ni+2x个球)。之后,所有右侧球的编号减1.给定每个球的颜色信息,希望最大化移除白球的数量。输出最优策略下,期望移除白球的数量。

数据范围

保证 1 ≤ n ≤ 30 , 0 ≤ k ≤ n 1\leq n\leq 30,0\leq k\leq n 1n30,0kn

题解

可以看到 n n n的值较小,可以想到状压DP,要倒着做,所以要用记搜。

f i , j f_{i,j} fi,j表示长度为 i i i的状态为 j j j的期望值, j j j记录的是每个球是否未被移除,则 f i , j = ∑ m a x ( f i − 1 , k 1 , f i − 1 , k 2 ) f_{i,j}=\sum max(f_{i-1,k_1},f_{i-1,k_2}) fi,j=max(fi1,k1,fi1,k2)

该做法时间复杂度为 O ( 2 n ∗ n ) O(2^n*n) O(2nn),会TLE。所以我们考虑进一步优化。

首先,如果设状态为每个球是否未被移除,则会有很多重复的状态。有时候剩下的球颜色序列相同,但状态不同。所以我们可以将状态记成剩下的颜色序列。

还有一个细节。即使时限为3s,但是如果所有状态都用map存,因为map存太多常数会很大,所以最后几个点还是会TLE。因此我们考虑把状态储存小的用数组存,状态储存大的用map,可以提高效率。具体做法见代码。

即使这样,最后一个点仍有可能TLE。我们考虑将状态数组再做一些修改。前文我们设 f i , j f_{i,j} fi,j表示长度为 i i i的状态为 j j j的期望值,第一维数组是否可以省去?

每一个长度为 i i i的状态,它的大小都小于 2 i 2^i 2i,所以我们可以试着省去第一维。但如果有状态重复的该如何处理呢?我们可以给每一个长度为 i i i的状态的第 i + 1 i+1 i+1位打上 1 1 1标记,表示这个状态长度为 i i i,这样就不会有状态重复了,代码的效率也会有一定的提升。

经过以上的处理,我们的代码可以跑得很快,3s的时限对我们来说就绰绰有余啦~

代码:

#include<bits/stdc++.h>
using namespace std;
int n,k;
double dp[1<<25];
char s[35];
map<int,double>f;
double dfs(int len,int t,int now){
    if(t>k) return 0;
    if(len>24&&f.find(now)!=f.end()) return f[now];
    if(len<=24&&dp[now]!=-1) return dp[now];
    double sum=0;
    int e,vnow;
    for(int i=1;i<=len/2;i++){
        double c1=0,c2=0;
        vnow=((now>>i)<<i-1)|(now&(1<<i-1)-1);
        c1=dfs(len-1,t+1,vnow)+((now>>i-1)&1);
        vnow=((now>>len-i+1)<<len-i)|(now&(1<<len-i)-1);
        c2=dfs(len-1,t+1,vnow)+((now>>len-i)&1);
        sum+=max(c1,c2)*2.0;
    }
    if(len&1){
        int i=len+1>>1;
        vnow=((now>>i)<<i-1)|(now&(1<<i-1)-1);
        sum+=dfs(len-1,t+1,vnow)+((now>>i-1)&1);
    }
    sum=sum/len;
    if(len>24) f[now]=sum;
    else dp[now]=sum;
    return sum;
}
int main()
{
    scanf("%d%d",&n,&k);
    scanf("%s",s+1);
    for(int s=0;s<(1<<25);s++) dp[s]=-1.0;
    int e=0;
    for(int i=1;i<=n;i++)
    if(s[i]=='W') e|=(1<<i-1);
    e|=(1<<n);
    printf("%.8f",dfs(n,1,e));
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值