*UVA10900_So you want to be a 2n-aire? _概率dp_连续概率

3 篇文章 0 订阅

题意

初始有1元,依次回答 n 道题,看到第 i 题时已知答对的概率,可选择

1.答题:答错收入0,答对乘2

2.不答:拿钱离开

每道题的概率为 t 到1的均匀分布。

每次答题前知道概率做出最优决策,求得到的钱的期望。

思路

求期望为倒推的dp

设 e[i] 为已答对 i 题时的最终能得到的钱的期望,e[i] 是分为两部分关于x的积分,x 为 t 到 1 间的均匀分布

e[i] = ∫1/(1 - t) * 2^i * dx (x * e(i + 1) < 2^i)  + ∫1/(1 - t) * x * e[i + 1] * dx (x >= ... && x <= 1)

#include <iostream>
#include <cstdio>
#include <cstring>
#include <algorithm>
#include <cmath>
#define INF 0x3f3f3f3f
#define rep0(i, n) for (int i = 0; i < n; i++)
#define rep1(i, n) for (int i = 1; i <= n; i++)
#define rep_0(i, n) for (int i = n - 1; i >= 0; i--)
#define rep_1(i, n) for (int i = n; i > 0; i--)
#define MAX(x, y) (((x) > (y)) ? (x) : (y))
#define MIN(x, y) (((x) < (y)) ? (x) : (y))
#define mem(x, y) memset(x, y, sizeof(x))
#define MAXN 40
using namespace std;
const double eps = 1e-8;
int n;
double t, ans, e[MAXN];
void solve()
{
    ans = 0;
    e[n] = 1 << n;

    for (int i = n - 1; i >= 0; i--)
    {
        double tmp = 1.0 * (1 << i) / e[i + 1];
        e[i] = 0;
        if (tmp > t)
            e[i] = (tmp - t) / (1 - t) * (1 << i);
        tmp = MAX(tmp, t);
        e[i] += e[i + 1] / (1 - t) / 2 * (1 - tmp * tmp);


    }

    printf("%.3f\n", e[0]);


}
int main()
{
    #ifndef ONLINE_JUDGE
        freopen("in.txt", "r", stdin);
    #endif // ONLINE_JUDGE

    while (scanf("%d %lf", &n, &t) != EOF && n)
    {
        solve();


    }




    return 0;
}

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值