ZOJ 3329 One Person Game 概率dp

题意:

现在有3个骰子每个骰子各有k1,k2,k3个面(1<=ki<=6)给定3个特殊数 a,b,c

游戏规则如下:

开始的计分为0

每次骰3个骰子 如果第一个骰子对应a且第二个骰子对应b且第三个骰子对应c分数清零否则加上这个3个骰子对应的数

如果分数超过规定的分数n结束游戏否则继续游戏

问骰的次数的期望

分析:

因为是求期望要倒着推嘛可以规定dp【i】为分数为i的期望那么当i>n的时候dp【i】的值必定为0啦

对于dp【i】下一次得到可以是dp【0】,dp【i+3】,dp【i+4】……dp【i+k1+k2+k3】

然后我就没有思路啦

参考网上的题解

dp【i】=sigema(dp【i+k】*pk)+dp【0】*p0+1  (3<=k<=k1+k2+k3)-----------------1

我们需要求的是dp【0】然而对于每个状态都含有dp【0】

那么我们不妨设dp【i】=A【i】*dp【0】+B【i】----------------------------------------------2

就可以转化为求dp【0】=B【0】/(1-A【0】)

那么如何求B【】和A【】呢?

我们把2式带入1式可以得到   dp【i】=sigema(A【i+k】+p0)*dp【0】+sigema(B【i+k】)+1

那么显然 A【i】=sigema(A【i+k】+p0) B【i】=sigema(B【i+k】)+1

这就是数学啊!!!还是太弱啦

ACcode:

#pragma warning(disable:4786)//使命名长度不受限制
#pragma comment(linker, "/STACK:102400000,102400000")//手工开栈
#include <map>
#include <set>
#include <queue>
#include <cmath>
#include <stack>
#include <cctype>
#include <cstdio>
#include <cstring>
#include <stdlib.h>
#include <iostream>
#include <algorithm>
#define rd(x) scanf("%d",&x)
#define rd2(x,y) scanf("%d%d",&x,&y)
#define rd3(x,y,z) scanf("%d%d%d,&x,&y,&z)
#define rdl(x) scanf("%I64d,&x);
#define rds(x) scanf("%s",x)
#define rdc(x) scanf("%c",&x)
#define ll long long int
#define ull unsigned long long
#define maxn 25
#define mod 1000000007
#define INF 0x3f3f3f3f //int 最大值
#define FOR(i,f_start,f_end) for(int i=f_start;i<=f_end;++i)
#define MT(x,i) memset(x,i,sizeof(x))
#define PI  acos(-1.0)
#define E  exp(1)
#define eps 1e-8
ll gcd(ll a,ll b){return b==0?a:gcd(b,a%b);}
ll mul(ll a,ll b,ll p){ll sum=0;for(;b;a=(a+a)%p,b>>=1)if(b&1)sum=(sum+a)%p;return sum;}
inline void Scan(int &x) {
      char c;while((c=getchar())<'0' || c>'9');x=c-'0';
      while((c=getchar())>='0' && c<='9') x=(x<<3)+(x<<1)+c-'0';
}
using namespace std;
double dp[maxn];
double A[maxn];
double B[maxn];
int n,k1,k2,k3,a,b,c,loop;
void init(double p){
    memset(dp,0,sizeof(dp));
    memset(A,0,sizeof(A));
    memset(B,0,sizeof(B));
    for(int kk1=1;kk1<=k1;++kk1)
            for(int kk2=1;kk2<=k2;++kk2)
                for(int kk3=1;kk3<=k3;++kk3)
                        if(kk1!=a||kk2!=b||kk3!=c)
                            dp[kk1+kk2+kk3]+=p;
}
int main(){
    scanf("%d",&loop);
    while(loop--){
        scanf("%d%d%d%d%d%d%d",&n,&k1,&k2,&k3,&a,&b,&c);
        int tot=k1*k2*k3;
        double p=1.0/tot;
        init(p);
        for(int i=n;i>=0;--i){
            for(int j=3;j<=k1+k2+k3;++j){
                A[i]+=dp[j]*A[i+j];
                B[i]+=dp[j]*B[i+j];
            }
            A[i]+=p;
            B[i]+=1;
        }
        printf("%.15lf\n",B[0]/(1.0-A[0]));
    }
    return 0;
}


  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值