Codeforces-865C Gotta Go Fast(期望dp)

传送门:CF-865C

题意:一个游戏一共有n个关卡,对于第i关,用a[i]时间通过的概率为p[i],用b[i]通过的时间为1-p[i],每通过一关后可以选择继续下一关或者时间清0并从第一关开始,先要求通过所有关卡的时间和不能超过R才算彻底通关,问直到彻底通关位置的游戏时间的期望值为多少

题解:期望dp+二分答案

f[i][j]表示当前为第i关,已用时j,通关的用时期望,mid表示从头开始通关的用时期望
设当前状态为(i,j):
①如果在挑战第i关前选择重新开始游戏,则通关的期望值为mid
②如果通过第i关用时为a[i],则继续进行游戏并通关的期望值为(f[i+1][j+a[i]]+a[i])*p[i]
③如果通过第i关用时为b[i],则继续进行游戏并通关的期望值为(f[i+1][j+b[i]]+b[i])*(1-p[i])

#include<bits/stdc++.h>
#define lson l,m,rt<<1
#define rson m+1,r,rt<<1|1
using namespace std;
typedef long long LL;
typedef pair<int, int> PII;
const double inf = 1e20;
const int MX = 55;
const int MM = 5500;
double f[MX][MM];
int a[MX], b[MX], p[MX];
int n, R;
/*f[i][j]表示当前为第i关,已用时j,通关的用时期望
mid表示从头开始通关的用时期望
设当前状态为(i,j):
①如果在挑战第i关前选择重新开始游戏,则通关的期望值为mid
②如果通过第i关用时为a[i],则继续进行游戏并通关的期望值为(f[i+1][j+a[i]]+a[i])*p[i]
③如果通过第i关用时为b[i],则继续进行游戏并通关的期望值为(f[i+1][j+b[i]]+b[i])*(1-p[i])
*/
bool ok(double mid) {
    for (int i = n - 1; i >= 0; i--) {
        for (int j = R + 1; j < MM; j++) f[i + 1][j] = mid;
        for (int j = 0; j <= R; j++) {
            double t1 = (f[i + 1][j + a[i]] + a[i]) * p[i] / 100;
            double t2 = (f[i + 1][j + b[i]] + b[i]) * (100 - p[i]) / 100;
            f[i][j] =  min(mid, t1 + t2);
        }
    }
    return f[0][0] < mid;
}
int main() {
    //freopen("in.txt", "r", stdin);
    scanf("%d%d", &n, &R);
    for (int i = 0; i < n; i++) scanf("%d%d%d", &a[i], &b[i], &p[i]);
    double l = 0, r = 1e10;
    for (int T = 1; T <= 100; T++) {
        double mid = (l + r) / 2;
        if (ok(mid)) r = mid;
        else l = mid;
    }
    printf("%.10f\n", l);
    return 0;
}


  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值