Codeforces 441E Valera and Number 概率DP

题目大意:

现在有如下的伪代码:

//input: integers x, k, p
a = x;
for(step = 1; step <= k; step = step + 1){
    rnd = [random integer from 1 to 100];
    if(rnd <= p)
        a = a * 2;
    else
        a = a + 1;
}

s = 0;

while(remainder after dividing a by 2 equals 0){
    a = a / 2;
    s = s + 1;
}

现在对于给定的x <= 10^9, k <= 200, 0 <= p <= 100求得到的s的期望值


大致思路:

感觉好难的一个概率DP...后来还是看了别人的题解AC掉的, CF官方题解是4维的DP表示不懂...看了一个大神的一个二维的题解..学习之


代码如下:

Result  :  Accepted     Memory  :  8 KB     Time  :  30 ms

/*
 * Author: Gatevin
 * Created Time:  2015/2/24 16:05:25
 * File Name: Codeforces_441E.cpp
 */
#include<iostream>
#include<sstream>
#include<fstream>
#include<vector>
#include<list>
#include<deque>
#include<queue>
#include<stack>
#include<map>
#include<set>
#include<bitset>
#include<algorithm>
#include<cstdio>
#include<cstdlib>
#include<cstring>
#include<cctype>
#include<cmath>
#include<ctime>
#include<iomanip>
using namespace std;
const double eps(1e-8);
typedef long long lint;

/*
 * (这里说的末尾0的个数指的都是对应的二进制后面连续0的个数)
 * 如果用dp[i][j]表示初始时将x加上j之后在第i次随机运行那个函数之后
 * 得到的末尾的连续的0的个数的期望
 * 初始化dp[0][0~k]为对应的x + j之后的末尾0的个数
 * 如果第i轮之后对于x + j的末尾的0的个数期望是dp[i][j]
 * 那么对于1 - p的可能性+1, 考虑对于i + 1轮的贡献可以发现
 * dp[i + 1][j] += dp[i][j + 1]*(1 - p)//这个+1可以是初始的时候的x+1
 * 对于*2的可能性有
 * dp[i + 1][j << 1] += (dp[i][j] + 1)*(1 - p)
 * 对于*2相当于初始的时候的x加的数翻倍了, 并且*2会导致末尾0的个数+1
 * 由于最多只有k次+1初始化的时候初始化dp[0][0~k]即可
 */
int x, k, p;
double dp[2][210];//滚动数组

int main()
{
    scanf("%d %d %d", &x, &k, &p);
    double P = p/100.;
    for(int i = 0; i <= k; i++)
    {
        int tmp = x + i;
        while(!(tmp & 1))
            tmp >>= 1, dp[0][i] += 1.;
    }
    int now = 0;
    for(int i = 0; i < k; i++)
    {
        memset(dp[now^1], 0, sizeof(dp[now^1]));
        for(int j = 0; j <= k; j++)
        {
            dp[now^1][j << 1] += (dp[now][j] + 1)*P;
            dp[now^1][j] += dp[now][j + 1]*(1 - P);
        }
        now ^= 1;
    }
    printf("%.10f\n", dp[now][0]);
    return 0;
}


区间DP是一种动态规划的方法,用于解决区间范围内的问题。在Codeforces竞赛中,区间DP经常被用于解决一些复杂的字符串或序列相关的问题。 在区间DP中,dp[i][j]示第一个序列前i个元素和第二个序列前j个元素的最优解。具体的转移方程会根据具体的问题而变化,但是通常会涉及到比较两个序列的元素是否相等,然后根据不同的情况进行状态转移。 对于区间长度为1的情况,可以先进行初始化,然后再通过枚举区间长度和区间左端点,计算出dp[i][j]的值。 以下是一个示例代码,展示了如何使用区间DP来解决一个字符串匹配的问题: #include <cstdio> #include <cstring> #include <string> #include <iostream> #include <algorithm> using namespace std; const int maxn=510; const int inf=0x3f3f3f3f; int n,dp[maxn][maxn]; char s[maxn]; int main() { scanf("%d", &n); scanf("%s", s + 1); for(int i = 1; i <= n; i++) dp[i][i] = 1; for(int i = 1; i <= n; i++) { if(s[i] == s[i - 1]) dp[i][i - 1] = 1; else dp[i][i - 1] = 2; } for(int len = 3; len <= n; len++) { int r; for(int l = 1; l + len - 1 <= n; l++) { r = l + len - 1; dp[l][r] = inf; if(s[l] == s[r]) dp[l][r] = min(dp[l + 1][r], dp[l][r - 1]); else { for(int k = l; k <= r; k++) { dp[l][r] = min(dp[l][r], dp[l][k] + dp[k + 1][r]); } } } } printf("%d\n", dp[n]); return 0; } 希望这个例子能帮助你理解区间DP的基本思想和应用方法。如果你还有其他问题,请随时提问。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值