题意:三个骰子,分别有k1,k2,k3个面,每次掷骰子,当分别为a,b,c是s回到0,否则s加上三个数字之和,s从0开始,当s大于n时结束,求掷骰子次数的期望。
解题思路:期望DP,从后往前推。dp[i]表示i到大于n的期望,dp[i] = p0*dp[0] + sum (pk*dp[i+k]) ,k为三个数字之和。接下来就是解这个方程了,这个方程有个特点,每次状态转移都会回到dp[0],而dp[0]正是我们要求的答案。一般解法:dp[i] = A[i]*dp[0] + B[i] , dp[i+k] = A[i+k]*dp[0] + B[i+k], 将上式带入状态转移方程,A[i] = po+sum(pk*A[i+k]),B[i] = sum(pk*B[i+k]) + 1 。求得A、B,dp[0] = A[0]*dp[0] + B[i]。
代码如下:
#include <stdio.h>
#include <string.h>
#include <algorithm>
#include <map>
#include <queue>
#include <vector>
#include <string>
#include <iostream>
#define N 1000
using namespace std;
double temp;
int n,k1,k2,k3,a,b,c;
double A[N],B[N];
double dfs(int u,double C[],double z)
{
if(u > n) return 0;
if(C[u] > 0) return C[u];
int i,j,k;
for(i = 1; i <= k1; i++)
for(j = 1; j <= k2; j++)
for(k = 1; k <= k3; k++)
{
if(i == a && j == b && k == c) continue;
C[u] += temp*dfs(u+i+j+k,C,z);
}
C[u] += z;
return C[u];
}
int main()
{
int t;
scanf("%d",&t);
while(t--)
{
scanf("%d%d%d%d%d%d%d",&n,&k1,&k2,&k3,&a,&b,&c);
temp = 1.0/(k1*k2*k3);
memset(A,0,sizeof(A));
memset(B,0,sizeof(B));
dfs(0,A,temp);
dfs(0,B,1.0);
printf("%.12lf\n",B[0]/(1-A[0]));
}
return 0;
}