Codeforces 859D Third Month Insanity 概率DP

题目链接:http://codeforces.com/contest/859/problem/D

题意:一个排球比赛,开始2^n个队,淘汰制,每一把比赛淘汰一半的人,然后给出了每个人赢其他人的概率,问一个人正确预测比赛结果的最大期望是多少?

解法:概率DP好题。比较久没写过概率DP了。复习一下,概率DP一般是dp[i]代表i到终点的期望,然后dp[i] = sigma(dp[j]+代价)*概率。。这道题比较特殊,我们可以把比赛过程看成在二叉树上的概率DP。win[i][j]表示在根节点为i第j个人赢的概率,e[i][j]代表第根节点为i第j个赢的期望,pro[i][j]表示第i个人赢第j个人的概率。然后按照概率DP的基本方法转移即可。


#include <bits/stdc++.h>
using namespace std;
const int maxn = 1010;
double win[maxn][maxn], e[maxn][maxn], pro[maxn][maxn];
int n, m, x;
void DFS(int p, int l, int r){
    if(l+1==r) win[p][l]=1,e[p][l]=0;
    else{
        int mid=(l+r)/2;
        DFS(p*2, l, mid);
        DFS(p*2+1, mid, r);
        for(int i=l; i<mid; i++)
            for(int j=mid; j<r; j++)
                win[p][i] += win[p*2][i]*win[p*2+1][j]*pro[i][j];
        for(int i=l; i<mid; i++)
            for(int j=mid; j<r; j++)
                e[p][i] = max(e[p][i], win[p][i]*(r-l)/2+e[p*2][i]+e[p*2+1][j]);

        for(int i=mid; i<r; i++)
            for(int j=l; j<mid; j++)
                win[p][i] += win[p*2+1][i]*win[p*2][j]*pro[i][j];
        for(int i=mid; i<r; i++)
            for(int j=l; j<mid; j++)
                e[p][i] = max(e[p][i], win[p][i]*(r-l)/2+e[p*2+1][i]+e[p*2][j]);
    }
}
int main()
{
    scanf("%d", &n);
    m = 1<<n;
    for(int i=0; i<m; i++){
        for(int j=0; j<m; j++){
            scanf("%d", &x);
            pro[i][j] = 0.01*x;
        }
    }
    DFS(1, 0, m);
    double maxv = 0;
    for(int i=0; i<m; i++) maxv = max(maxv, e[1][i]);
    printf("%.10f\n", maxv);
    return 0;
}


区间DP是一种动态规划的方法,用于解决区间范围内的问题。在Codeforces竞赛中,区间DP经常被用于解决一些复杂的字符串或序列相关的问题。 在区间DP中,dp[i][j]表示第一个序列前i个元素和第二个序列前j个元素的最优解。具体的转移方程会根据具体的问题而变化,但是通常会涉及到比较两个序列的元素是否相等,然后根据不同的情况进行状态转移。 对于区间长度为1的情况,可以先进行初始化,然后再通过枚举区间长度和区间左端点,计算出dp[i][j]的值。 以下是一个示例代码,展示了如何使用区间DP来解决一个字符串匹配的问题: #include <cstdio> #include <cstring> #include <string> #include <iostream> #include <algorithm> using namespace std; const int maxn=510; const int inf=0x3f3f3f3f; int n,dp[maxn][maxn]; char s[maxn]; int main() { scanf("%d", &n); scanf("%s", s + 1); for(int i = 1; i <= n; i++) dp[i][i] = 1; for(int i = 1; i <= n; i++) { if(s[i] == s[i - 1]) dp[i][i - 1] = 1; else dp[i][i - 1] = 2; } for(int len = 3; len <= n; len++) { int r; for(int l = 1; l + len - 1 <= n; l++) { r = l + len - 1; dp[l][r] = inf; if(s[l] == s[r]) dp[l][r] = min(dp[l + 1][r], dp[l][r - 1]); else { for(int k = l; k <= r; k++) { dp[l][r] = min(dp[l][r], dp[l][k] + dp[k + 1][r]); } } } } printf("%d\n", dp[n]); return 0; } 希望这个例子能帮助你理解区间DP的基本思想和应用方法。如果你还有其他问题,请随时提问。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值