SCOI2008 奖励关

最新推荐文章于 2019-03-05 19:02:57 发布

「已注销」

最新推荐文章于 2019-03-05 19:02:57 发布

阅读量173

点赞数

本文链接：https://blog.csdn.net/g21wcr/article/details/87892597

版权

洛谷传送门

期望DP，用记忆化搜索实现。看到15这种小数据，就应该立刻想到状态压缩。
用 $f$ 数组记录期望。现在已选的宝藏状态为 $n o w$ ，现在要选第 $t$ 个宝藏，那么 $f [n o w] [t]$ 表示这时的期望。

为了避免一些非法的情况，考虑倒推。对于记忆化搜索来说，就是一个回溯的过程。
如果当前状态为 $n o w$ ，现在决定第 $t$ 个宝藏，枚举到一个宝藏 $i$ ，而当前 $n o w$ 又满足可以取到 $i$ ，那么就在取和不取之间求 $m a x$ ，对应代码就是：
$f[now][t]+=max((dp(now|2^{i-1},t+1)+val[i])/n,dp(now,t+1)/n);$

再解释一下——
取的话，就是（走这一步的情况的期望（递归求解） $+$ 当前宝藏的贡献) $\times$ （走到当前情况的概率）
不取的话，就是（走这一步的情况的期望（递归求解）) $\times$ （走到当前情况的概率）
由于期望的线性性，加起来就好了。

注意一下，虽然 $n < = 15$ ，但是 $k < = 100$ ， $f$ 数组要开够。。。

代码如下：

#include<bits/stdc++.h>
using namespace std;
const int maxn=105;
const int maxm=1<<16;
int need[maxn],k;
bool vis[maxm][maxn];
double f[maxm][maxn],val[maxn],n;
inline int read(){
	int f=1,x=0;char ch=getchar();
	while(!isdigit(ch)){if(ch=='-')f=-1;ch=getchar();}
	while(isdigit(ch)) x=(x<<3)+(x<<1)+ch-'0',ch=getchar();
	return x*f;
}
//now表示现在状态    t表示正在选第几轮 
//t>k时，已经不合法了，返回0就好了。
inline double dp(int now,int t){
	if(t>k) return 0;
	if(vis[now][t]) return f[now][t];
	f[now][t]=0,vis[now][t]=1;
	for(int i=1;i<=n;++i){
		if((now&need[i])==need[i])
		f[now][t]+=max((dp(now|(1<<(i-1)),t+1)+val[i])/n,dp(now,t+1)/n);
		else f[now][t]+=dp(now,t+1)/n;
	}return f[now][t];
}
int main(){
	scanf("%d%lf",&k,&n);
	for(int i=1;i<=n;++i){
		val[i]=(double)read();
		while(int d=read()) need[i]|=1<<(d-1);
	}printf("%.6lf",dp(0,1));
}

「已注销」

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
SCOI2008 奖励关

洛谷传送门期望DP，用记忆化搜索实现。看到15这种小数据，就应该立刻想到状态压缩。用fff数组记录期望。现在已选的宝藏状态为nownownow，现在要选第ttt个宝藏，那么f[now][t]f[now][t]f[now][t]表示这时的期望。为了避免一些非法的情况，考虑倒推。对于记忆化搜索来说，就是一个回溯的过程。如果当前状态为nownownow，现在决定第ttt个宝藏，枚举到一个宝藏ii...
复制链接

扫一扫