HDU3853 期望DP入门

这篇博客介绍了一道ACM竞赛中的题目,涉及到在n*m网格中从(1,1)移动到(n,m)的期望步数计算。博主通过动态规划(期望DP)的方法解决了这个问题,强调了从终态向初始状态倒推的策略,并提供了代码实现。文章讨论了如何处理移动概率和期望步数的关系,以及在处理可能存在的错误时的注意事项。
摘要由CSDN通过智能技术生成
题目链接

http://acm.hdu.edu.cn/showproblem.php?pid=3853

题意

nm网格,每个点可以花费2进行移动,移动是右,下,原地不动,这三者都有其概率,问1-1到n-m期望步数

思路

题目似乎有BUG,不过无所谓了

期望DP入门题,DP[i][j]为ij处到终点期望步数,显然DP[n][m]=0,DP[1][1]为答案,易写出方程

dp[i][j]=(2+dp[i][j+1]*p2[i][j]+dp[i+1][j]*p3[i][j])/(1.0-p1[i][j]);
教训/收获

期望DP常见套路,将dp状态存储的值定义为到达终态的期望,最终求初始状态期望。需要从终态倒推

代码
#include<cstdio>
#include<iostream>
#include<iomanip>
#include<map>
#include<unordered_map>
#include<string>
#include<queue>
#include<stack>
#include<cstring>
#include<algorithm>
#include<cmath>
#include<cstdlib> 
#include<chrono>
#define IOS ios::sync_with_stdio(false);cin.tie(0);cout.tie(0);
#define endl "\n"
//#define int long long
//#define double long double
using namespace std;
	typedef long long ll;
	const int maxn=1005;
	const int inf=0x3f3f3f3f;
	int n,m,k;
    double dp[maxn][maxn];
    double p1[maxn][maxn],p2[maxn][maxn],p3[maxn][maxn];
	signed main(){
		#ifndef ONLINE_JUDGE
		    freopen("IO\\in.txt","r",stdin);
		    freopen("IO\\out.txt","w",stdout);
        #endif
		int tn=1;
        while(~scanf("%d%d",&n,&m)){
            memset(dp,0,sizeof dp);
            for(int i=1;i<=n;i++)
                for(int j=1;j<=m;j++){
                    scanf("%lf%lf%lf",&p1[i][j],&p2[i][j],&p3[i][j]);
                }
            for(int i=n;i;i--)
                for(int j=m;j;j--){
                    if(i==n&&j==m)  continue;
                    if(p1[i][j]==1.0)   continue;
                    dp[i][j]=(2+dp[i][j+1]*p2[i][j]+dp[i+1][j]*p3[i][j])/(1.0-p1[i][j]);
                }
            printf("%.3lf\n",dp[1][1]);
        }
	} 
						
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值