AcWing 218 数学期望 + DP

最新推荐文章于 2024-07-16 10:17:07 发布

SHOHOKUKU

最新推荐文章于 2024-07-16 10:17:07 发布

阅读量129

点赞数

分类专栏：数学 DP

本文链接：https://blog.csdn.net/neweryyy/article/details/115401051

版权

数学同时被 2 个专栏收录

164 篇文章 0 订阅

订阅专栏

159 篇文章 1 订阅

订阅专栏

该博客介绍了一种使用动态规划解决AcWing218题目——扑克牌翻开问题的方法。通过从终止状态开始，以起始状态为目标进行状态转移，计算达到特定条件时还需翻开牌的期望数量。在记忆化搜索过程中，博主分析了不同花色的贡献，并考虑了大小王的处理。最终，通过递归函数实现求解，输出合法状态的期望翻牌数，若无解则返回正无穷。

摘要由CSDN通过智能技术生成

题意

传送门 AcWing 218 扑克牌

题解

满足条件的终止状态较多，而起始状态唯一。考虑以终止状态为初值，起始状态为目标，进行动态规划。 $d p [a] [b] [c] [d] [x] [y]$ 代表初始条件为当前已翻开状态下，还需哟翻开牌的期望数。前 $4$ 个状态为已翻开的各类牌的数量，后 $2$ 个状态分别代表大、小王的状态（ $0$ 为未翻开， $1$ 代表已翻开且当做黑桃，以此类推）。设 $r s t$ 为剩余牌的数量。

若 $a < 13$ ，则当前抽到黑桃的贡献为 $\frac{13-a}{rst}\times dp[a+1][b][c][d][x][y]$ 其余花色同理。若小王未抽取，取可转移状态期望最小的一个进行状态转移，其贡献为 $\frac{1}{rst}\times\min\limits_{1\leq i\leq 4}dp[a][b][c][d][i][y]$

记忆化搜索求解，若无牌可抽仍未到达 $\& b >= B \&c >= C \& d >= D$ 的终止状态，则期望为正无穷，代表不合法的状态。

#include <bits/stdc++.h>
using namespace std;
const double inf = 1e9;
double dp[14][14][14][14][5][5];
bool vs[14][14][14][14][5][5];
int A, B, C, D;

inline void add(int &a, int &b, int &c, int &d, int x)
{
    if (x == 1)
        ++a;
    else if (x == 2)
        ++b;
    else if (x == 3)
        ++c;
    else if (x == 4)
        ++d;
}

double rec(int a, int b, int c, int d, int x, int y)
{
    double &res = dp[a][b][c][d][x][y];
    if (vs[a][b][c][d][x][y])
        return res;
    vs[a][b][c][d][x][y] = 1;
    res = 0;
    int ta = a, tb = b, tc = c, td = d;
    add(ta, tb, tc, td, x), add(ta, tb, tc, td, y);
    if (ta >= A && tb >= B && tc >= C && td >= D)
        return 0;
    int rst = 54 - ta - tb - tc - td;
    if (!rst)
        return inf;
    if (a < 13)
        res += rec(a + 1, b, c, d, x, y) * (13 - a) / rst;
    if (b < 13)
        res += rec(a, b + 1, c, d, x, y) * (13 - b) / rst;
    if (c < 13)
        res += rec(a, b, c + 1, d, x, y) * (13 - c) / rst;
    if (d < 13)
        res += rec(a, b, c, d + 1, x, y) * (13 - d) / rst;
    if (!x)
        res += min(min(rec(a, b, c, d, 1, y), rec(a, b, c, d, 2, y)), min(rec(a, b, c, d, 3, y), rec(a, b, c, d, 4, y))) / rst;
    if (!y)
        res += min(min(rec(a, b, c, d, x, 1), rec(a, b, c, d, x, 2)), min(rec(a, b, c, d, x, 3), rec(a, b, c, d, x, 4))) / rst;
    return ++res;
}

int main()
{
    scanf("%d%d%d%d", &A, &B, &C, &D);
    double res = rec(0, 0, 0, 0, 0, 0);
    if (res > 54)
        puts("-1.000");
    else
        printf("%.3f\n", res);
    return 0;
}