bzoj 1076 奖励关

最新推荐文章于 2020-11-29 01:05:17 发布

二分抄代码

最新推荐文章于 2020-11-29 01:05:17 发布

阅读量95

点赞数

分类专栏：概率期望 DP

本文链接：https://blog.csdn.net/liufengwei1/article/details/88075365

版权

DP 同时被 2 个专栏收录

87 篇文章 0 订阅

订阅专栏

概率期望

21 篇文章 0 订阅

订阅专栏

从数据范围和先决条件这两个东西可以看出要状压

顺推发现那个当前要决定吃还是不吃，决定不出后以后都不能再吃完全不知道怎么处理。

然后看了题解，有人说这种中间要抉择最优策略一般都是从后往前推

f[i][s]表示从第i天到第k天，第i天已有宝物为s的时候，能增加的价值的期望

假设当前新增宝物为j而且j是可吃的话 f[i][s]+=max(f[i+1][s],f[i+1][s|1<<(j-1)]+a[j])/n;

不可吃的话f[i][s]+=f[i+1][s]/n

上面那个顺推无法处理的问题，假设f[i+1][s]要更大一些的话，首先说明a[j]是负数，其次说明由于加了a[j]导致无论后面怎么选择，期望都不会比不选a[j]要大，那么这就相当于这里不选a[j]，后面也不可能加a[j]了，因为后面选择了a[j]后，剩下的选择次数比现在更少，更不可能弥补a[j]造成的损失。

#include<bits/stdc++.h>
#define maxl 110
using namespace std;

int k,n,len;
int a[maxl],pre[maxl];
double ans;
double f[maxl][1<<15];
inline void prework()
{
	scanf("%d%d",&k,&n);
	int x;
	for(int i=1;i<=n;i++)
	{
		scanf("%d",&a[i]);
		while(scanf("%d",&x) && x)
			pre[i]|=1<<(x-1);
	}
}

inline void mainwork()
{
	f[0][0]=1;
	len=1<<n;int t;
	for(int i=k;i>=1;i--)
		for(int s=0;s<len;s++)
			for(int j=1;j<=n;j++)
			{
				t=s|(1<<(j-1));
				if((s&pre[j])==pre[j])
					f[i][s]+=max(f[i+1][t]+a[j],f[i+1][s])/n;
				else
					f[i][s]+=f[i+1][s]/n;
			}
}

inline void print()
{
	ans=0;double sum=0;
	printf("%.6f\n",f[1][0]);
}

int main()
{
	prework();
	mainwork();
	print();
	return 0;
}

二分抄代码

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
bzoj 1076 奖励关

从数据范围和先决条件这两个东西可以看出要状压顺推发现那个当前要决定吃还是不吃，决定不出后以后都不能再吃完全不知道怎么处理。然后看了题解，有人说这种中间要抉择最优策略一般都是从后往前推f[i][s]表示从第i天到第k天，第i天已有宝物为s的时候，能增加的价值的期望假设当前新增宝物为j而且j是可吃的话 f[i][s]+=max(f[i+1][s],f[i+1][s|1&lt;&lt;(...
复制链接

扫一扫

专栏目录