[51nod1450]闯关游戏

Description

有n个游戏,互相独立,对于第i个游戏,每次玩有1-xi-yi的概率失败,xi的概率获得一颗星,yi的概率获得两颗星。对于每个游戏我们会记录你的历史最好成绩。
对于所有游戏,通关的条件为:所有游戏都有星,且总成绩至少有M颗星
求从0开始玩游戏,最优策略下的通关期望次数
n,m<=2000

Solution

感觉自己数学真差。。。QwQ
推了一个下午都没理解,晚上某个时候豁然开朗才写出来
首先最优策略肯定是:按y从小到大排序,从某个时刻i开始,以后的游戏都一定要玩到2星
那么我们就设Fi,j表示:前i个游戏,获得j颗星的概率,Gi,j表示期望步数
对于某一个游戏,获得星星的期望步数为1/(xi+yi),获得两颗星的期望步数为1/yi
达成1星的概率为xi/(xi+yi),达成2星的概率为yi/(xi+yi)
那么直接转移,维护一个期望步数的后缀和就好了
注意在某一步,如果对于ans有贡献,那么为了避免算重,计算完贡献之后要把这个位置的F和G清空

Code

#include <cstdio>
#include <cstring>
#include <algorithm>
#define fo(i,a,b) for(int i=a;i<=b;i++)
#define fd(i,a,b) for(int i=a;i>=b;i--)
using namespace std;

typedef double db;

const int N=2*1e3+5;

struct pty{db x,y;}a[N];
bool cmp(pty x,pty y) {return x.y<y.y;}
int n,m;
db f[N][N*2],g[N][N*2],suf[N],ans;

int main() {
    scanf("%d%d",&n,&m);
    fo(i,1,n) {
        scanf("%lf%lf",&a[i].x,&a[i].y);
        a[i].x/=1000.0;a[i].y/=1000.0;
    }
    sort(a+1,a+n+1,cmp);
    fd(i,n,1) suf[i]=suf[i+1]+1/a[i].y;
    if (n*2==m) {
        printf("%.7lf\n",suf[1]);
        return 0;
    }
    f[0][0]=1;
    fo(i,1,n) {
        db px=a[i].x/(a[i].x+a[i].y),py=a[i].y/(a[i].x+a[i].y);
        db c=1/(a[i].x+a[i].y);
        fo(j,1,n*2) 
            if ((n-i)*2>=m-j) {
                f[i][j]+=f[i-1][j-1]*px;
                if (j>1) f[i][j]+=f[i-1][j-2]*py;
                g[i][j]+=(g[i-1][j-1]+c*f[i-1][j-1])*px;
                if (j>1) g[i][j]+=(g[i-1][j-2]+c*f[i-1][j-2])*py;
                if ((n-i)*2==m-j) {
                    ans+=g[i][j]+f[i][j]*suf[i+1];
                    f[i][j]=g[i][j]=0;
                }
            }
    }
    fo(i,m+1,n*2) ans+=g[n][i];
    printf("%.7lf\n",ans);
}
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值