题意:我方宝可梦和敌方宝可梦分别处于混乱状态和冰冻状态,所以每次对局敌方宝可梦无法进行攻击,而我方宝可梦有p的概率给敌方造成w伤害,(1-p)的概率给自己造成w伤害,我方宝可梦有hp1的血量,敌方有hp2的血量,当血量小于等于0的时候游戏就结束了,问你游戏进行的局数的期望是多少。
思路:前段时间刚做了2018吉林的一道期望dp,也是问的是游戏进行轮数的期望,居然没想到而是去想爆搜,羞耻 ,很明显我们可以用dp[ i ][ j ]来表示当前我方和地方宝可梦血量分别为i和j时,还差多少局结束游戏。
可知状态转移方程为:
dp[ i ][ j ] = dp[ max(i-w,0) ][ j ]*(1-p) + dp[ i ][max(j-w,0) ]*p + 1;
初始化dp[i][0]和dp[0][i]都为0即可。
看到类似游戏局数期望的字眼往期望dp想一想,虽然不一定是。
代码:
#include <bits/stdc++.h>
using namespace std;
typedef long long ll;
const int MAXN = 3e3 + 7;
double dp[MAXN][MAXN];//期望dp dp[i][j]表示当前第一个玩家血量为i 第二个玩家为j时还差多少局游戏结束
int h1,h2,w;double p;
int main()
{
int t;
scanf("%d",&t);
while(t--){
scanf("%d%d%d%lf",&h1,&h2,&w,&p);
for(int i = 0;i <= h1;i ++) dp[i][0] = 0;
for(int i = 0;i <= h2;i ++) dp[0][i] = 0;
for(int i = 1;i <= h1;i ++){
for(int j = 1;j <= h2;j ++){
dp[i][j] = dp[max(0,i-w)][j]*(1.0-p) + dp[i][max(0,j-w)]*p + 1.0;
}
}
printf("%.6f\n",dp[h1][h2]);
}
return 0;
}