动态规划-简单了解下什么是期望DP

Cx_330_PLT

于 2024-02-16 23:07:59 发布

阅读量2.5k

点赞数 59

文章标签：动态规划算法

本文链接：https://blog.csdn.net/estiny_123123/article/details/136133548

版权

本文介绍了期望动态规划（期望DP），它是一种处理涉及概率和期望值的动态规划问题的方法。文章详细阐述了其基本原理，状态转移方程的构建，以及如何在实际问题中应用，如一个关于英雄分类的游戏期望天数计算的示例。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

首先说明下为啥是简单了解下，因为对于期望DP的问题，相较于一般的动态规划问题，可以说期望DP的题目相对较少，并且往往具有一定的难度。这是因为期望DP在解决问题时需要考虑状态的期望值，涉及到概率和随机性的计算，因此可能需要运用更多的数学知识和技巧，所以我们作为入门还是了解下。

期望DP是一种动态规划的应用方法，用于解决具有期望值的问题。在许多问题中，我们不仅关心某个状态的具体值，还关心该状态的期望值，即在多次实验中，该状态的平均值。期望DP就是利用动态规划的思想，计算解决具有期望值的问题。

在期望DP中，我们将问题转化为求解状态的期望值，而不仅仅是状态的具体值。通过定义状态和状态转移方程，我们可以递推计算得到状态的期望值，从而求解问题。通常，期望DP与普通的动态规划方法类似，但需要在状态转移方程中加入期望值的计算。

期望DP的一个难度在于没有一个固定的模板，只有一个大致框架：

#include <iostream>
#include <vector>

using namespace std;

// 定义全局变量
const int MAX_N = 1000;
double dp[MAX_N];  // 存储状态值

double expectedDP(int n) {
    // 初始化边界条件
    dp[0] = 0;  // 根据具体问题进行初始化

    // 动态规划状态转移
    for (int i = 1; i <= n; i++) {
        // 定义状态转移方程
        dp[i] = (/*根据具体问题定义转移方程*/);
    }

    return dp[n];  // 返回最终的期望值
}

int main() {
    int n;
    cin >> n;

    cout << "Expected DP: " << expectedDP(n) << endl;

    return 0;
}

dp 数组用于存储不同状态下的期望值。因为是大致框架，你需要根据具体的问题定义状态转移方程中的计算逻辑。在实际使用中，根据问题的不同，可能需要引入更多的辅助变量和数据结构来存储和计算期望值。
我们同样通过一道例题来对期望DP的实际应用留下印象。题目的意思是说一个游戏里面对英雄进行分类，一共有 nn 种职业， mm 种阵营。小蓝每天玩一个英雄，这个英雄属于某一种职业，也属于某一种阵营。每个英雄属于某个职业的概率是 1nn1 ，属于某种阵营的概率是 1mm1 。求小蓝玩遍了所有职业和阵营的期望天数。

大致思路：

令 dp[i][j] 为小蓝已经玩过 i 种职业，j个阵营之后，达到最终状态的期望天数。这里的最终状态是玩遍所有的职业与阵营。

那么我们可以得到 dp[n][m]=0 ，因为已经达到了目标状态，所以我们可以倒推，我们要求的答案就是 dp[0][0]。（求概率一般是正推，求期望一般是逆推）。

考虑 dp[i][j]的状态转移：