ZOJ3329 One Person Game 概率dp

/*
    题目描述:有三个骰子,每个上面的数值分别是1~K1 , 1 ~K2 , 1 ~K3,有一个计数器,其初始值为0,现在抛三枚
         骰子,如果当前计数器的值加上这三枚骰子的点数和大于n,那么游戏结束,否则将计数器的值加上点数和后
         游戏继续,但是,如果掷出的三枚骰子的值为a,b,c时,计数器的值清零,先问游戏中投掷骰子的期望是多少?

    思路:设dp[i]表示计数器视数为i时还要抛掷骰子的次数期望,那么有
            dp[i] = 1 / (K1 * K2 * K3) * (dp[0] + Σdp[S]) + 1       ,关键就是这个方程怎么推
            通过观察,每个dp[i]中都有固定的dp[0]项,所以设dp[i] = A[i] * dp[0] + B[i]
            根据dp方程可知A[i] = 1 / (K1 * K2 * K3) + (1 / (K1 * K2 * K3))^2 * ΣA[S]
                                        B[i] = 1 / (K1 * K2 * K3) *ΣB[S] + 1
            而dp[n] = 1 / (K1 * K2 * K3) * dp[0] + 1 , 所以A[n] = 1 / (K1 * K2 * K3) , B[n] = 1;
            倒推出A[0] , B[0],因为dp[0] = A[0] * dp[0]  + B[0]  ,所以dp[0] = B[0] / (1 - A[0])
    收获:这种列出方程之后发现既不知道dp[0] , 也不知道dp[n]的问题,也就是说把所有dp方程放在一起是一个方程组
        的,可以考虑观察其形式,设出方程的一般形式,然后通过递推求出方程中的参数,类似原理的还有Hdu4035
*/
#pragma warning(disable:4786)
#pragma comment(linker, "/STACK:102400000,102400000")
#include<iostream>
#include<cstdio>
#include<cstring>
#include<algorithm>
#include<stack>
#include<queue>
#include<map>
#include<set>
#include<vector>
#include<cmath>
#include<string>
#include<sstream>
#include<bitset>
#define LL long long
#define FOR(i,f_start,f_end) for(int i=f_start;i<=f_end;++i)
#define mem(a,x) memset(a,x,sizeof(a))
#define lson l,m,x<<1
#define rson m+1,r,x<<1|1
using namespace std;
const int INF = 0x3f3f3f3f;
const int mod = 1e9 + 7;
const double PI = acos(-1.0);
const double eps=1e-9;
const int maxn = 500 + 5;
double dp[maxn] , A[maxn] , B[maxn];
int main()
{
    int T , n , K1 , K2 , K3 , a , b , c;
    scanf("%d", &T);
    while(T--){
        scanf("%d %d %d %d %d %d %d" , &n , &K1 , &K2 , &K3 , &a , &b , &c);
        double p = 1.0 / K1 / K2 / K3;
        A[n] = p;       B[n] = 1;
        for(int i = n - 1 ; i >= 0 ; i--){
            A[i] = p;       B[i] = 1;
            for(int d1 = 1 ; d1 <= K1 ; d1 ++){
                for(int d2= 1 ; d2 <= K2 ; d2 ++){
                    for(int d3 = 1 ; d3 <= K3 ; d3 ++){
                        if(d1 == a && d2 == b && d3 == c)       continue;
                        if(i + d1 + d2 + d3 > n)        continue;
                        A[i] += p * A[i + d1 + d2 + d3];
                        B[i] += p * B[i + d1 + d2 + d3];
                    }
                }
            }
        }
        double ans = B[0] / (1 - A[0]);
        printf("%.10lf\n",ans);
    }
    return 0;
}

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值