思路:既然是求到终点的期望,那么DP代表期望,所以DP[i][j]=原地的概率*DP[i][j]+向右的概率*DP[i+1][j]+想下的概率*DP[i][j+1]+2,2代表所花费的水晶,那么只要从终点递归到起点即可求解。
#include <iostream>
#include <stdio.h>
#include <cstring>
#define MAX 1010
using namespace std;
double p1[MAX][MAX];
double p2[MAX][MAX];
double p3[MAX][MAX];
double DP[MAX][MAX];
int i,j,R,C;
int main()
{
while(scanf("%d%d",&R,&C)!=EOF)
{
for(i=1;i<=R;i++)
for(j=1;j<=C;j++)
scanf("%lf%lf%lf",&p1[i][j],&p2[i][j],&p3[i][j]);
memset(DP,0,sizeof(DP));
for(i=R;i>0;i--)
for(j=C;j>0;j--)
{
if(i==R&&j==C) continue;
if(p1[i][j]==1.00) continue;
DP[i][j]=(p2[i][j]*DP[i][j+1]+p3[i][j]*DP[i+1][j]+2)/(1-p1[i][j]);
}
printf("%.3lf\n",DP[1][1]);
}
}