P2473 [SCOI2008]奖励关 - 期望（神奇的倒推） - 状态压缩

最新推荐文章于 2021-11-15 14:29:53 发布

Zolrk

最新推荐文章于 2021-11-15 14:29:53 发布

阅读量304

点赞数 1

分类专栏： NOIP 动态规划概率与期望

本文链接：https://blog.csdn.net/fantasy_world/article/details/82909702

版权

NOIP 同时被 3 个专栏收录

169 篇文章 0 订阅

订阅专栏

动态规划

49 篇文章 0 订阅

订阅专栏

概率与期望

3 篇文章 0 订阅

订阅专栏

大力模拟各种情况
k * n 的模拟出每次可能抛什么出来
设f[k][s] 为前k个物品状态为s时得分最大值
但是有问题啊，比如 113 和 133，状态都是f[3][101]，难道我还要多开一维存下不同情况？，不行吧？

还是说取最大的？，这相当于后面选择的物品，对前面的状态强行选择了一下，但是并不是说113比133大，我就舍弃133，我舍弃133就相当于，走到这一步，后面直接都不走了，如果说我们要取最优解，显然可以取最大的，舍弃掉不优的，但是对于一种需要递推，或者是求期望的这种要求把所有可能都走一遍取平均值的，不能舍弃吧？舍弃这个状态，就好像求平均数的时候，你舍弃了几个比较小的数，那么无论如何这个平均数都是错误的吧？

这种转移感觉就很麻烦的，试着倒推，不是说拿东西么，我们把过程倒过来，扔东西，从第n个阶段每个阶段扔一个东西并获得收益，也就是说f[k][s]表示前k个状态为s时，k+1 ~ n轮获得的期望收益，而答案是f[1][0]

这代表了什么呢，为什么倒推的时候，是由前面的状态决定能不能“扔”？
实际上，假设有一种方案是01011吧，这个假设说明最后物品集合就是01011，只不过我们在预知了这个集合的情况下，把过程逆过来，那么我这个物品能不能扔，意味着这个物品（在正向过程中）能不能选，所以状态的设定是从k+1轮到最后的收益，但其物品集合却是第1 ~ k 轮选择的物品集合。从i + 1 到 i，只要f[i+1][j]中的j满足i的需求，就可以转移

有很多无用的状态也会发生转移，不过在取max的基础上这些转移无法到达最后，貌似状压有一部分题的转移都是这样的，一些状态本来不应该存在，但是在取max或者min的时候这些状态一定比那些应该存在的状态更不优，所以如果能证明出这点，不用考虑那么多直接转移就好

期望的和等于和的期望是划分阶段的关键条件，因为不同阶段的期望相加之后就是整个过程的期望，所以可以递推

#include <algorithm>
#include <iostream>
#include <cstring>
#include <cstdio>
using namespace std;
#define debug(x) cerr << #x << "=" << x << endl;
const int MAXN = 100000 + 10;
struct object{
	double val;
	int si;
}ob[MAXN];
double ans,f[101][1<<15];
int n,k;

int main() {
	scanf("%d%d", &k, &n);
	for(int i=1; i<=n; i++) {
		cin >> ob[i].val;
		int si = 0;
		while(1) {
			int pos = 0;
			scanf("%d", &pos);
			if(!pos) break;
			si |= 1 << (pos-1);
		}
		ob[i].si = si; 	
	}
	for(int i=k; i; i--) {
		for(int j=0; j<1<<n; j++) {
			for(int x=1; x<=n; x++) {
				 int si = ob[x].si;
				 if((j&si) == si) {
				 	f[i][j] += max(f[i+1][j], f[i+1][j|(1<<(x-1))] + ob[x].val);
				 } else {
				 	f[i][j] += f[i+1][j];
				 }
			}
			f[i][j] /= n;
		}
	}
	printf("%.6lf", f[1][0]);
	return 0;
}

Zolrk

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
P2473 [SCOI2008]奖励关 - 期望（神奇的倒推） - 状态压缩

大力模拟各种情况k * n 的模拟出每次可能抛什么出来设f[k][s] 为前k个物品状态为s时得分最大值但是有问题啊，比如 113 和 133，状态都是f[3][101]，难道我还要多开一维存下不同情况？，不行吧？还是说取最大的？，这相当于后面选择的物品，对前面的状态强行选择了一下，但是并不是说113比133大，我就舍弃133，我舍弃133就相当于，走到这一步，后面直接都不走了，如果说我们...
复制链接

扫一扫