题意:
有n个格子,编号分别是1—N,每个格子下面有黄金,每到一个格子就掷骰子,掷到的点数就是你下一次跳跃的距离,骰子的有6面,点数分别为1~6,每次掷的点数是等概率的,如果你掷色子使你跳到第N格外面,则重新掷骰子。问到达n点的所获得黄金的期望是多少?
思路:
概率DP:一般求概率是正推,求期望是逆推。
设dp[i]表示当前位置在i处到达N处得到的金币期望,
dp[i]=SUM(dp[i+1],dp[i+2]…dp[i+6])/6+a[i];
当N−i<6时,注意特殊处理。
所以,正解应当是:dp[i]+=dp[i+j]/min(N-i, 6);当然,由于dp[i]定义是从后达到i时候的状态,故i点的金币是100%会拿到的,所以在输入的时候我就令他们取等了。
#include <iostream>
#include <cstdio>
#include <cmath>
#include <string>
#include <cstring>
#include <algorithm>
#include <limits>
#include <vector>
#include <stack>
#include <queue>
#include <set>
#include <map>
using namespace std;
typedef long long ll;
const int maxN=105;
int N;
double dp[maxN], a[maxN];
int main()
{
int T;
scanf("%d", &T);
for(int Cas=1; Cas<=T; Cas++)
{
scanf("%d", &N); memset(dp, 0, sizeof(dp));
for(int i=1; i<=N; i++) { scanf("%lf", &a[i]); dp[i]=a[i]; }
for(int i=N-1; i>=1; i--)
{
for(int j=1; j<=6; j++)
{
if(i+j<=N) dp[i]+=dp[i+j]/(double)min(N-i, 6);
}
}
printf("Case %d: %.6lf\n", Cas, dp[1]);
}
return 0;
}