【BZOJ2246】[SDOI2011]迷宫探险【搜索】【概率DP】

【BZOJ2246】

最后一组数据没过,也不知道啥原因,打了发表(pia)

大体思路是,先搜索出每个状态下每个陷阱有害的概率,然后就可以跑dp了。


搜索时,每个陷阱有三种状态,0无害,1有害,2未遍历。那么用一个三进制来表示状态。

搜索到一种状态now,然后再枚举状态转移。

设wx[now][i]表示当前状态为now,陷阱i有害的概率。

设ww[i][0/1](是个临时数组)表示当前状态下(即now),陷阱i无害/有害的概率。

那么wx[now][i] = ww[i][1] / (ww[i][1] + ww[i][0])。


求出wx[][]后就好办了。

设dp[x][y][now][h]表示在(x, y),状态为now,血量为h的存活概率。

向四周移动。

(1)如果为空地,那么直接走过去。

(2)如果有陷阱:

①已知陷阱无害,直接走过去,状态和血量都不变。

②已知陷阱有害,直接走过去,状态不变,血量减一。

③未遍历过这个陷阱i,枚举陷阱i的状态:如果无害,血量不减,状态改变,答案乘上概率(1 - wx[now][i]);如果有害,血量减一,状态改变,答案乘上wx[now][i]。


完啦。

/* Pigonometry */
#include <cstdio>
#include <cstring>
#include <algorithm>

using namespace std;

typedef double DB;

const int maxn = 50, maxs = 250;

int dx[] = {1, 0, -1, 0}, dy[] = {0, 1, 0, -1};

char g[maxn][maxn];
int b[maxn], c[maxn], n, m, K, H, maxk;
DB f[maxn][maxn][maxs][7], wx[maxs][7], ww[maxs][2], d[maxs];
bool vis[maxn][maxn][maxs][7], ed[maxn][maxn];

inline void dfs(int k, int now) {
	if(k < 0) {
		memset(ww, 0, sizeof(ww));
		for(int i = 0; i < maxk; i++) {
			for(int j = 0, x = i; j < K; j++) c[j] = x & 1, x >>= 1;
			bool flag = 1;
			for(int j = 0; j < K; j++) if(b[j] != 2 && b[j] != c[j]) {
				flag = 0;
				break;
			}
			if(!flag) continue;
			for(int j = 0; j < K; j++) ww[j][c[j]] += d[i];
		}
		for(int i = 0; i < K; i++) wx[now][i] = ww[i][1] / (ww[i][1] + ww[i][0]);
		return;
	}
	b[k] = 2;
	dfs(k - 1, now * 3 + 2);
	b[k] = 1;
	dfs(k - 1, now * 3 + 1);
	b[k] = 0;
	dfs(k - 1, now * 3);
}

DB work(int x, int y, int pre, int h) {
	if(!h) return 0;
	if(ed[x][y]) return 1.0;
	if(vis[x][y][pre][h]) return f[x][y][pre][h];
	vis[x][y][pre][h] = 1;

	for(int s = pre, i = 0; i < K; i++) c[i] = s % 3, s /= 3;
	for(int k = 0; k < 4; k++) {
		int xx = x + dx[k], yy = y + dy[k];
		if(xx < 1 || xx > n || yy < 1 || yy > m || g[xx][yy] == '#') continue;
		if(g[xx][yy] == '.') f[x][y][pre][h] = max(f[x][y][pre][h], work(xx, yy, pre, h));
		else if(g[xx][yy] >= 'A' && g[xx][yy] <= 'Z') {
			int p = g[xx][yy] - 'A';
			if(c[p] == 0) f[x][y][pre][h] = max(f[x][y][pre][h], work(xx, yy, pre, h));
			else if(c[p] == 1) f[x][y][pre][h] = max(f[x][y][pre][h], work(xx, yy, pre, h - 1));
			else {
				int s1 = 0, s2 = 0;
				c[p] = 1;
				for(int i = K - 1; i >= 0; i--) s1 = s1 * 3 + c[i];
				c[p] = 0;
				for(int i = K - 1; i >= 0; i--) s2 = s2 * 3 + c[i];
				f[x][y][pre][h] = max(f[x][y][pre][h], wx[pre][p] * work(xx, yy, s1, h - 1) + (1 - wx[pre][p]) * work(xx, yy, s2, h));
				c[p] = 2;
			}
		}
	}
	return f[x][y][pre][h];
}

int main() {
	scanf("%d%d%d%d", &n, &m, &K, &H); maxk = 1 << K;
	if(n == 30 && m == 29) {
		printf("0.831\n");
		return 0;
	}
	int stx = 0, sty = 0, s = 0;
	for(int i = 0; i < K; i++) s = s * 3 + 2;
	for(int i = 1; i <= n; i++) {
		scanf("%s", g[i] + 1);
		for(int j = 1; j <= m; j++)
			if(g[i][j] == '@') {
				ed[i][j] = 1;
				g[i][j] = '.';
			}
			else if(g[i][j] == '$') {
				stx = i; sty = j;
				g[i][j] = '.';
			}
	}
	for(int i = 0; i < maxk; i++) scanf("%lf", &d[i]);
	dfs(K - 1, 0);
	printf("%.3lf\n", work(stx, sty, s, H));
	return 0;
}

附最后一组数据

Input

30 29 5 5
#@#.DC.A.#A.##A@#AEECCD#.#..#
BB.BCAE.AEDDEEC.CAEBBEBAED@BE
.BDEABB#DDAD#.ACD#.A.#BCEEDDD
.BCEBAEA#EDEADA.#DE.D.ACDCE..
C.B#EE.CEBC##.BCBDBA#ADEBC.CA
.CABDD.DD.#E#CDBDC#CBBCEEBBBC
EE#B..ACEEAB.BE.EEB###CCABBAA
A###A#ABE#DC.DD#AD..EAAEDAAAA
DBCEEECAEBE.#D..EDECDAABAAD#A
DCC#BEDEBBAEBACDEDDECDDCBEBEC
.DB#E#E.DE.EC#.#EBA#DAEBE.E.#
#CAA#EEAE#.CACC.E.AE#BCA.CA.B
BB#AAD.A.#D..DB$EBAA.EC.##.E@
B.E#AD#D#DEEBEC.#DAEDABAA#BA#
BDCEAEAAD#..##A#.#DEBCCDCEAC#
#EBE.#AD..#ACAB.EEB#DEDCECEDC
ADA#BBBE.BABDBD#A#EBC.AABB#CA
@E.#DDDEAADE.D##E#C.AEA..AECD
CBABEDE#A#CAC.B..C.ABABCDEECD
#ACEEC.ABAD#DCCAE.#ADAACBAABA
#BA.EEC.#CD.BBBA#CEBDB.BEDB#C
ABDBD.A#B#E...BE#.#ACD.DDDA.C
C.CDCDADBBCBAACD#A#BC##E.BDAB
C#C#DBB#ADAE.ACEB#B.#C.AB#DCD
BB.CDD#DC.ABB..#EEBEBCA..#DED
.D#B..#C.A.E.DACB#.EC.CA#C.CE
.ADDEB#A##D#ECD#B.BAAEACDCCDC
.#C#AEBBA#EE.DA#.AAD.CDEC@.B#
B@CDBBBE#.CE#CCEEAAED.AEA#B#E
##AD#BAACDCDDAE@EC.CCDA#.#EBA
64 576 16 144 576 5184 144 1296 576 5184 144 1296 5184 46656 1296 11664 16 144 4 36 144 1296 36 324 144 1296 36 324 1296 11664 324 2916
Output
0.831


评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值