概率期望dp入门题---游戏

题目

Alice 和 Bob 两个人正在玩一个游戏,游戏有很多种任务,难度为 p 的任务(p是正整数),有 1/(2^p) 的概率完成并得到 2^(p-1) 分,如果完成不了,得 0 分。一开始每人都是 0 分,从 Alice 开始轮流做任务,她可以选择任意一个任务来做;而 Bob 只会做难度为 1 的任务。只要其中有一个人达到 n 分,即算作那个人胜利。求 Alice 采取最优策略的情况下获胜的概率。
输入格式
一个正整数 n ,含义如题目所述。
输出格式
一个数,表示 Alice 获胜的概率,保留 6 位小数。
样例数据 1
输入
1
输出
0.666667
备注
【数据范围】
对于 30% 的数据,n≤10
对于 100% 的数据,n≤500

我们选择倒推(感觉好多期望概率dp都要倒推啊)

用a[i][j]表示Alice有i分Bob有j分时Alice的获胜概率

那么就有4种可能

Alice完成,Bob未完成;Alice未完成,Bob完成;两人都完成;两人都未完成;

可以得到递推式

a[i][j]=max((a[l][j]/k/4+a[l][j+1]/k/4+a[i][j+1](k21)/k/4)/(1.01.0(k21.0)/k/4)|0<=i<=n10<=j<=n1a[i][j]=max((a[l][j]/k/4+a[l][j+1]/k/4+a[i][j+1]∗(k∗2−1)/k/4)/(1.0−1.0∗(k∗2−1.0)/k/4)|0<=i<=n−1;0<=j<=n−1)

其中

l=k+il=k+i
k=1;k/2<=n;k<<=1k=1;k/2<=n;k<<=1

k是枚举Alice选择不同任务赢后的分数

代码

#include<bits/stdc++.h>
using namespace std;
double a[505][505];
int n;
int main(){
    cin>>n;
    for(int i=0;i<=n;i++)
    a[n][i]=1;
    for(int i=n-1;i>=0;i--)
    for(int j=n-1;j>=0;j--)
    {
        double maxn=0;
        for(int k=1;k/2<=n;k<<=1)
        {
            int l=k+i;
            if(l>n) l=n;
            double tmp=(a[l][j]/k/4+a[l][j+1]/k/4+a[i][j+1]*(k*2-1)/k/4)/(1.0-1.0*(k*2-1.0)/k/4);
            if(tmp>maxn) maxn=tmp;
        }
        a[i][j]=maxn;
    }
    printf("%lf",a[0][0]);
}

转载于:https://www.cnblogs.com/forever-/p/9736079.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值