【codeforces 148DBag of mice】【概率dp】【记忆化】

【链接】

http://codeforces.com/problemset/problem/148/D

【题意】

原来袋子里有w只白鼠和b只黑鼠 ,龙和王妃轮流从袋子里抓老鼠。

谁先抓到白色老鼠谁就赢。

王妃每次抓一只老鼠,龙每次抓完一只老鼠之后会有一只老鼠跑出来。

每次抓老鼠和跑出来的老鼠都是随机的。

如果两个人都没有抓到白色老鼠则龙赢。王妃先抓。 问王妃赢的概率

【思路】

dp[i][j]表示现在的状态为i只白鼠,j只黑鼠,王妃赢得可能性

赢的 状态来自于:

1.直接选到白色:i/(i+j)

2.王妃选到黑黑鼠,那么龙必须也要黑鼠。

   若逃跑一只黑鼠,(i,j)的获胜状态取决于dp[i,j-3]*j/(i+j)*(j-1)/(i+j-1)*(j-2)/(i+j-2)

   若逃跑一只白鼠,(i,j)的获胜概率取决于dp[i-1,j-2]*i/(i+j)*(j-1)/(i+j-1)*i/(i+j-2)

【dp代码】

#include<cstdio>
#include<cstring>
#include<map>
#include<iostream>
#include<iostream>
#include<vector>
#include<string>
#include<algorithm>
using namespace std;
using ll=long long;
const int maxn = 1e3+6;
const int inf = 0x3f3f3f3f;
const int mod = 1e9 + 7;
double dp[maxn][maxn];

int main() {
	int w, b;
	scanf("%d%d", &w, &b);
	for(int i=1;i<=w;i++)dp[i][0] = 1;
	for (int i = 1; i <= b;i++)dp[0][i] = 0;
	for (int i = 1; i <= w; i++) {
		for (int j = 1; j <= b; j++) {
			dp[i][j] += i * 1.0 / (i + j);
			if(j>=3)dp[i][j] += 1.0*j / (i + j)*(j - 1) / (i + j - 1)*(j - 2) / (i + j - 2)*dp[i][j - 3];
			if(j>=2)dp[i][j] += 1.0*j / (i + j)*(j - 1) / (i + j - 1)*i / (i + j - 2)*dp[i - 1][j - 2];
		}
	}
	printf("%.10f\n", dp[w][b]);
}
const int maxn = 1000 + 10;
int T, n, m, vis[maxn][maxn][2], w, b;
double d[maxn][maxn][2];
double dp(int a, int b, int id) {
	double ans = 0;
	if (a == 0) return 0;
	if (a != 0 && b == 0) {
		if (id) return 0;
		else return 1;
	}
	if (vis[a][b][id] != -1) return d[a][b][id];
	vis[a][b][id] = 1;
	if (id) {
		if (b > 1) ans += dp(a, b - 2, id ^ 1) *b /(a + b) * (b - 1) / (a + b - 1);
		if (b > 0 && a > 0) ans += dp(a - 1, b - 1, id ^ 1) *b / (a + b) *a / (a + b - 1);
	}
	else {
		if (a > 0) ans += (double)(a) / (a + b);
		if (b > 0) ans += dp(a, b - 1, id ^ 1) * b / (a + b);
	}
	return d[a][b][id]=ans;
}
int main() {
	memset(vis, -1, sizeof(vis));
	scanf("%d%d", &w, &b);
	double ans = dp(w, b, 0);
	printf("%.10f\n", ans);
	return 0;
}

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
区间DP是一种动态规划的方法,用于解决区间范围内的问题。在Codeforces竞赛中,区间DP经常被用于解决一些复杂的字符串或序列相关的问题。 在区间DP中,dp[i][j]表示第一个序列前i个元素和第二个序列前j个元素的最优解。具体的转移方程会根据具体的问题而变,但是通常会涉及到比较两个序列的元素是否相等,然后根据不同的情况进行状态转移。 对于区间长度为1的情况,可以先进行初始,然后再通过枚举区间长度和区间左端点,计算出dp[i][j]的值。 以下是一个示例代码,展示了如何使用区间DP来解决一个字符串匹配的问题: #include <cstdio> #include <cstring> #include <string> #include <iostream> #include <algorithm> using namespace std; const int maxn=510; const int inf=0x3f3f3f3f; int n,dp[maxn][maxn]; char s[maxn]; int main() { scanf("%d", &n); scanf("%s", s + 1); for(int i = 1; i <= n; i++) dp[i][i] = 1; for(int i = 1; i <= n; i++) { if(s[i] == s[i - 1]) dp[i][i - 1] = 1; else dp[i][i - 1] = 2; } for(int len = 3; len <= n; len++) { int r; for(int l = 1; l + len - 1 <= n; l++) { r = l + len - 1; dp[l][r] = inf; if(s[l] == s[r]) dp[l][r] = min(dp[l + 1][r], dp[l][r - 1]); else { for(int k = l; k <= r; k++) { dp[l][r] = min(dp[l][r], dp[l][k] + dp[k + 1][r]); } } } } printf("%d\n", dp[n]); return 0; } 希望这个例子能帮助你理解区间DP的基本思想和应用方法。如果你还有其他问题,请随时提问。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值