LightOJ - 1395 A Dangerous Maze (II) (期望+dp)

题目链接

题目是LightOJ - 1027 A Dangerous Maze的加强版,即多了一个条件,探险者能记住k个门,也就是在返回k次过程中这几个门不会再走一遍,接下来经过的每个门的概率就会变化,求出去的时间期望。

思维跟简单版的相似,每经过一个门出去期望都要考虑两种情况之和:一是能出去,二是返回再走一次才出去

k \geqslant d_{back}时,(d_{back}为返回的门数)

       意味着每个返回都能记住,那么记完全部返回门时接下来走的都是出去门,

               期望就是dp[k=d_{back}]=\frac{1}{n-d_{back}}*\sum t_{out}=\frac{\sum t_{out}}{d_{out}}

k < d_{back}时,

              期望就是dp[k]=\frac{1}{n-k}*\sum t_{out}+\frac{1}{n-k}*((d_{back}-k)*(dp[k]+\frac{\sum t_{back}}{d_{back}})),(\frac{\sum t_{back}}{d_{back}}表示选择了k个返回门后,再从剩下的负值门里选择一个门的平均值,即返回门的平均值)

    整理得:

              dp[k]=\frac{1}{n-d_{back}}*(\sum t_{out}+(d_{back}-k)*\frac{\sum t_{back}}{d_{back}})

然后从后往前推,dp[i]=\frac{1}{n-i}*\sum t_{out}+\frac{1}{n-i}*((d_{back}-i)*(dp[i+1]+\frac{\sum t_{back}}{d_{back}}))0\leq i<d_{back}

注意一点,求得期望是分数,给的值都是整数,涉及除法时要乘以1.0.

#include<cstdio>
#include<cmath>
#include<cstring>
using namespace std;
int a[105];
double dp[105];
int main(){
	int T,t=1;scanf("%d",&T);
	while(T--){
		int n,k;scanf("%d%d",&n,&k);
		int t_out=0,t_back=0;
		int d_out=0,d_back=0;
		for(int i=0;i<n;i++){
			scanf("%d",&a[i]);
			if(a[i]>0){
				t_out+=a[i];
				d_out++;
			} 
			else{
				t_back+=abs(a[i]);
				d_back++;
			}
		}
		printf("Case %d: ",t++);
		if(d_out==0){
			printf("-1\n");
			continue;
		}
		memset(dp,0,sizeof(dp));
		if(k>=d_back){ //能记住所有的返回门 
			k=d_back;
			dp[k]=1.0*t_out/d_out;   
		}
		else dp[k]=1.0*(t_out+1.0*(d_back-k)*t_back/d_back)/(n-d_back);
		if(k==0){
			printf("%lf\n",dp[k]);
			continue;
		}
		for(int i=k-1;i>=0;i--)
			dp[i]=1.0*(t_out+1.0*(d_back-i)*(dp[i+1]+1.0*t_back/d_back))/(n-i);
		printf("%lf\n",dp[0]);
	}
	return 0;
}

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值