UVA10900 So you want to be a 2n-aire?（概率dp）

最新推荐文章于 2023-08-18 14:52:09 发布

lshacm

最新推荐文章于 2023-08-18 14:52:09 发布

阅读量720

点赞数

分类专栏： acm_动态规划

本文链接：https://blog.csdn.net/u013514182/article/details/46319047

版权

acm_动态规划专栏收录该内容

46 篇文章 0 订阅

订阅专栏

题意：一共可以答n道题目，初始奖金为1，每次答对题目奖金翻倍，答错奖金清零。每次答对题目的概率在[t,1]变动。求最佳策略下能获得的期望奖金。
解法：概率dp
1.dp[i]:答对第i题的期望奖金
初始化:dp[n]=2^n
2.如果t*dp[i+1]>2^i，则一定回答第i+1题。此时 $dp[i]=(1+t)/2*dp[i+1]$
如果t*dp[i+1]<=2^i，则不一定回答第i+1题。设bp（边缘概率）=2^i/dp[i+1]，如果答对i+1题的概率小于bp，那么不选择答i+1题，否则选择答第i+1题，此时 $dp[i]=dp[i]=(bp-t)/(1.0-t)*p2[i]+(1.0-bp)/(1.0-t)*(1.0+bp)/2.0*dp[i+1];$

#include<stdio.h>
#include<string.h>
#include<math.h>
#include<algorithm>
#include<iostream>
#include<vector>
#include<map>
#include<set>
#define ll long long
using namespace std;

const int maxn = 100+10;

int n;
double T;
double p2[maxn];//2^i
double dp[maxn];

void init(){
    p2[0]=1;
    for(int i=1;i<=30;i++) p2[i]=p2[i-1]*2.0;
}

int main(){
    init();
    while(scanf("%d%lf",&n,&T)!=EOF){
        if(n==0&&T==0) break;
        memset(dp,0,sizeof(dp));
        dp[n]=p2[n];
        for(int i=n-1;i>=0;i--){
            double bp=p2[i]/dp[i+1];
            if(T>bp){
                dp[i]=(T+1)/2.0*dp[i+1];
            }
            else{
                dp[i]=(bp-T)/(1.0-T)*p2[i]+(1.0-bp)/(1.0-T)*(1.0+bp)/2.0*dp[i+1];
            }
        }
        printf("%.3lf\n",dp[0]);
    }
    return 0;
}

lshacm

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
UVA10900 So you want to be a 2n-aire?（概率dp）

题意：一共可以答n道题目，初始奖金为1，每次答对题目奖金翻倍，答错奖金清零。每次答对题目的概率在[t,1]变动。求最佳策略下能获得的期望奖金。解法：概率dp
复制链接

扫一扫

专栏目录