普通概率DP
dp[i]表示到游戏结束还需要的步数的期望。dp[n] =0;i>n时dp[i] = 0;
然后逆推dp[i] = dp[i+j]/6 (j为1-6) 然后每次加一,代表又投掷了一次骰子。
有飞行通道的点dp[i] = dp[vis[i]];
#include <stdio.h>
#include <string.h>
#include <algorithm>
#include <cstring>
#define ll long long
double dp[100005];
int vis[100005];
int main()
{
int n,m;
while(scanf("%d%d",&n,&m)!=EOF){
if((n+m)==0)break;
memset(vis,-1,sizeof(vis));
for(int i=1;i<=m;i++){
int a,b;
scanf("%d%d",&a,&b);
vis[a]=b;
}
memset(dp,0,sizeof(dp));
for(int i=n-1;i>=0;i--){
if(vis[i]==-1){
for(int j=1;j<=6;j++){
dp[i]+=dp[i+j]/6.0;
}
dp[i]+=1;
}
else
dp[i]=dp[vis[i]];
}
printf("%.4lf\n",dp[0]);
}
return 0;
}