zoj3329(期望DP)

最新推荐文章于 2021-04-11 23:28:35 发布

slmady

最新推荐文章于 2021-04-11 23:28:35 发布

阅读量566

点赞数

文章标签：期望DP

本文链接：https://blog.csdn.net/u013509299/article/details/40475593

版权

acm概率题专栏收录该内容

4 篇文章 0 订阅

订阅专栏

题意：三个骰子，分别有k1,k2,k3个面，每次掷骰子，当分别为a,b,c是s回到0，否则s加上三个数字之和，s从0开始，当s大于n时结束，求掷骰子次数的期望。

解题思路：期望DP，从后往前推。dp[i]表示i到大于n的期望，dp[i] = p0*dp[0] + sum (pk*dp[i+k]) ,k为三个数字之和。接下来就是解这个方程了，这个方程有个特点，每次状态转移都会回到dp[0],而dp[0]正是我们要求的答案。一般解法：dp[i] = A[i]*dp[0] + B[i] , dp[i+k] = A[i+k]*dp[0] + B[i+k], 将上式带入状态转移方程，A[i] = po+sum(pk*A[i+k]),B[i] = sum(pk*B[i+k]) + 1 。求得A、B,dp[0] = A[0]*dp[0] + B[i]。

代码如下：

#include <stdio.h>
#include <string.h>
#include <algorithm>
#include <map>
#include <queue>
#include <vector>
#include <string>
#include <iostream>
#define N 1000
using namespace std;
double temp;
int n,k1,k2,k3,a,b,c;
double A[N],B[N];
double dfs(int u,double C[],double z)
{
    if(u > n)   return 0;
    if(C[u] > 0)   return C[u];
    int i,j,k;
    for(i = 1; i <= k1; i++)
        for(j = 1; j <= k2; j++)
            for(k = 1; k <= k3; k++)
            {
                if(i == a && j == b && k == c)  continue;
                C[u] += temp*dfs(u+i+j+k,C,z);
            }
    C[u] += z;
    return C[u];
}
int main()
{
    int t;
    scanf("%d",&t);
    while(t--)
    {
        scanf("%d%d%d%d%d%d%d",&n,&k1,&k2,&k3,&a,&b,&c);
        temp = 1.0/(k1*k2*k3);
        memset(A,0,sizeof(A));
        memset(B,0,sizeof(B));
        dfs(0,A,temp);
        dfs(0,B,1.0);
        printf("%.12lf\n",B[0]/(1-A[0]));

    }
    return 0;
}