概率DP算法总结

最新推荐文章于 2022-07-10 13:44:57 发布

光球层上的黑子

最新推荐文章于 2022-07-10 13:44:57 发布

阅读量2.2k

点赞数 1

分类专栏： DP

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/TheSunspot/article/details/118118595

版权

概率DP

顾名思义，概率DP就是动态规划求概率的问题。一般来说，我们将dp数组存放的数据定义为到达此状态的概率，那么我们初值设置就是所有初始状态概率为1，最终答案就是终末状态dp值了。

我们在进行状态转移时，是从初始状态向终末状态顺推，转移方程中大致思路是按照当前状态去往不同状态的位置概率转移更新DP，且大部分是加法。

期望DP

用于求解期望的DP。这类问题一般将dp数组存放的数据定义为到达终态还需要的期望值。那么初值设置就是终末状态期望为0，答案就是初始状态的dp值了。

我们在进行状态转移时，一般是从终末状态逆推到起始状态，转移方程大致思路是找到当前状态所有可以转移到的状态，将它们的期望依概率相加即可。这是对于不同行动有概率的情况，比如投骰子。但对于多种情况互斥可选的时候(一般题目会告知你取最优策略)，比如飞行棋投骰子/钻隧道二选一移动，这时可能就需要取max或min来转移了

转移方程的“过程”与“静态”细节

这个小细节是我做题发现的，所以也不太好说规范的描述他,这里只是总结一下思路。
在HDU3853中，我们有原地罚站这一操作，每次移动有代价，我们写的DP方程是诸如
$dp[i]=\sum dp[j]*pj +dp[i]*p_{罚站} +代价$

最低0.47元/天解锁文章

光球层上的黑子

关注

1
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
概率DP算法总结

概率DP顾名思义，概率DP就是动态规划求概率的问题。一般来说，我们将dp数组存放的数据定义为到达此状态的概率，那么我们初值设置就是所有初始状态概率为1，最终答案就是终末状态dp值了。我们在进行状态转移时，是从初始状态向终末状态顺推，转移方程中大致思路是按照当前状态去往不同状态的位置概率转移更新DP，且大部分是加法。期望DP用于求解期望的DP。这类问题一般将dp数组存放的数据定义为到达终态还需要的期望值。那么初值设置就是终末状态期望为0，答案就是初始状态的dp值了。我们在进行状态转移时，一般是从终末
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。