ZOJ3329 概率DP变形

哇哦,感觉有点难哦,三个骰子,分别具有k1,k2,k3个面,抛骰子,若向上的一面分别对应为a,b,c,那么得分归0,否则得分加上三个骰子向上那一面数字之和,求得分超过n的时候抛骰子的次数的期望

一开始很容易想到常规的做法,以目标状态为边界,当前状态到目标状态所需要的期望为方程,dp[i]代表 当前到目标分数的期望,这是发现状态转移是这个样子的

dp[i] = dp[0] * p0 + sigma(pk * dp[i + k]) + 1;

p0,代表抛到分数归0 的概率,pk代表抛到分数为k的概率,这时候发现无法去做,因为我们所要求的答案就是dp[0],而每一步的状态转移里都包括了dp[0],同时前面是累积求和,这就相当于有个“环”一样,就像方程两边都有要求的未知数,但是无法移到同一边去,卡死了,首先觉得自己可能方程假设的不好,但是想了很久也没有其它的方程比这个合理了,后来看了这个博客:http://blog.csdn.net/xingyeyongheng/article/details/25639827
步骤讲解还是比较详细的,我是没有想到这个方面去,看了他的假设以后我就自己用草稿纸去往下推了,写了一大堆还是写出来了

首先假设dp[i] = A[i] * dp[0] + B[i];

这里发现dp[0] = A[0] * dp[0] + B[0];

目标就是要求出A[0],B[0],所以这个方程 要跟状态转移联系在一起的,

那么dp[i + k] = A[i + k] * dp[0] + B[i + k],然后把这个代入状态转移方程中去

dp[i] = dp[0] * p0 + sigma(pk*(A[i + k] * dp[0] + B[i + k])) + 1;化简一下

dp[i] = (sigma(pk * A[i + k]) + p0) * dp[0] + sigma(pk*B[i + k]) + 1;

那么A[i] = (sigma(pk * A[i + k]) + p0) ;

B[i] = sigma(pk*B[i + k]) + 1;

这里可以递推出A[0],B[0]

然后再回到假设方程去考虑

dp[0] = A[0] * dp[0] + B[0]

这里发现dp[0] 其实在这里不算是变量了,跟一个常数一样,所以上面才那样做出假设的,没有想到这点所以不知道如何处理,唉~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值