bzoj1076（概率与期望dp入门）

最新推荐文章于 2019-08-19 16:50:00 发布

running_in_dark

最新推荐文章于 2019-08-19 16:50:00 发布

阅读量1.2k

点赞数 1

分类专栏：概率与期望 dp

本文链接：https://blog.csdn.net/running_in_dark/article/details/53291406

版权

dp 同时被 2 个专栏收录

6 篇文章 1 订阅

订阅专栏

概率与期望

1 篇文章 0 订阅

订阅专栏

题目大意：给定k次弹出宝物的机会，每次随机弹出n种宝物的机会，如果吃过这种宝物的所有前提宝物就可以吃这种宝物，求最优策略的期望得分

看到数据范围果断状压DP- - 不看数据范围害死人- -

至于吃还是不吃这是个问题

对于这种最优策略的期望DP 我们一般都是从后往前推

枚举每次挑战枚举此时的状态枚举宝物是哪种

如果当前的宝物可以吃就在吃与不吃的后继状态中选择最大值加到当前状态上

如果当前的宝物不能吃只能选择不吃的后继状态加到当前状态上

最后输出f[1][0]就是答案

#include<cstdio>
#include<cstring>
#include<cmath>
#include<algorithm>
#include<cstdlib>
using namespace std;
typedef double db;
int n,k;
double f[105][1<<17],sc[17];
int t[17];

int main()
{
	scanf("%d%d",&k,&n);
	int j;
	for (int i=1;i<=n;i++)
	{
		scanf("%lf",&sc[i]);
		while (scanf("%d",&j)&&j!=0) t[i]=t[i]|(1<<(j-1));
	}
	
	int S=1<<n;
	for (int i=k;i>=1;i--)
	{
		for (j=0;j<S;j++) 
		{
			for (int l=1;l<=n;l++) 
			{
				if ((j|t[l])==j) f[i][j]+=max(f[i+1][j],f[i+1][j|(1<<(l-1))]+sc[l])/n;
				else f[i][j]+=f[i+1][j]/n;
			}
		}
	}
	
	printf("%.6lf",f[1][0]);
	return 0;
}

总结：

对于这种最优策略的期望DP 我们一般都是从后往前推，倒推会好做很多，因为最后的答案就是F[1][0]。顺推不好判断当前状态是否有效。（倒推是有效从有效推来，无效随

便，因为答案就是一个有效状态；而顺推则可能从无效推到有效）