第一次做概率dp,对期望理解的还不到位,先写一下现在的感悟,理解不足希望指教啊!
e[i]表示i的位置走道n所需要的期望步数
那么e[i]怎么求,首先e[i]走道e[i+1]的概率为1/6 ,而e[i+1]是走道终点的期望步数,所以e[i]=e[i+1]*1/6+1,为什么加一呢,因为你向前走了一步,期望表示的是步数
一次类推 e[i]=1+e[i+1]*1/6+e[i+2]*1/6+e[i+3]*1/6...+e[i+6]*1/6
推荐一个blog 讲的很好http://kicd.blog.163.com/blog/static/126961911200910168335852/
#include<iostream>
#include<cstdio>
using namespace std;
#define M 100005
int pa[M];
double e[M];
int main(){
int n,m,x,y;
while(scanf("%d%d",&n,&m),m+n){
for(int i=0;i<=n;i++) {
pa[i]=-1;
e[i]=0;
}
while(m--){
scanf("%d%d",&x,&y);
pa[x]=y;
}
e[n]=0;
for(int i=n-1;i>=0;i--){
if(pa[i]!=-1) e[i]=e[pa[i]];
else{
for(int j=1;j<=6;j++){
if(i+j<=n)
e[i]+=e[i+j]/6*1.0;
else break;
}
e[i]+=1.0;//期望表示的就是步数,向前走了一步,期望就是加一
}
}
printf("%.4lf\n",e[0]);
}
}