期望&概率dp总结

转载来自:期望&概率dp总结
这篇博客写得好,膜一番dalao。

1.期望dp

期望dp通常逆推,即从结果推向初始状态,也可以用记忆化搜索进行dp;
E=Σp1(E1+X1)+Σp2(E+X2)
其中E为当前状态的期望,E1为下一个状态的期望,p1和X1分别为将当前状态转移到下一个状态的概率和花费,p2和X2分别为保持当前状态的概率和花费。
最后化简为 E=(Σp1(E1+X1)+Σp2X2)/(1Σp2)

2.概率dp

概率dp通常顺推,即从初始状态推向结果, E=Σp1E1
其中E为当前状态的概率,E1为上一个状态的概率,p1是由上一个状态转移到当前状态的概率

3.高斯消元

当概率dp不能用递推式进行状态转移时,就需要用到高斯消元
如果有n个状态,则需要建立 n(n+1) 行的矩阵,用 A[i][j] 表示
A[i][j] 表示由状态i转移到状态j的概率,通常将最后一列设为0,再让 A[i][i]+=1

const double eps = 1e-6;  
typedef vector<double> vec;  
typedef vector<vec> mat;  
vec gauss_jordan(const mat& A, const vec& b) {  
    int n = A.size();  
    mat B(n, vec(n + 1));  
    for (int i = 0; i < n; i++)  
        for (int j = 0; j < n; j++) B[i][j] = A[i][j];  
    for (int i = 0; i < n; i++) B[i][n] = b[i];  
    for (int i = 0; i < n; i++) {  
        int pivot = i;  
        for (int j = i; j < n; j++) {  
            if (fabs(B[j][i]) > fabs(B[pivot][i])) pivot = j;  
        }  
        swap(B[i], B[pivot]);  
        if (fabs(B[i][i]) < eps) return vec();  
        for (int j = i + 1; j <= n; j++) B[i][j] /= B[i][i];  
        for (int j = 0; j < n; j++) {  
            if (i != j) {  
                for (int k = i + 1; k <= n; k++) B[j][k] -= B[j][i] * B[i][k];  
            }  
        }  
    }  
    vec x(n);  
    for (int i = 0; i < n; i++) x[i] = B[i][n];  
    return x;  
}  
期望dp概率dp是两种不同的动态规划方法。 期望dp是指通过计算每个状态的期望值来求解最终的期望。在期望dp中,我们通常定义dp\[i\]表示在第i个状态时的期望值,然后通过状态转移方程来更新dp数组,最终得到最终状态的期望值。期望dp通常用于求解期望问题,例如求解骰子的期望点数、求解抽奖的期望次数等。 概率dp是指通过计算每个状态的概率来求解最终的概率。在概率dp中,我们通常定义dp\[i\]表示在第i个状态时的概率,然后通过状态转移方程来更新dp数组,最终得到最终状态的概率概率dp通常用于求解概率问题,例如求解抛硬币出现正面的概率、求解从一副牌中抽到红心的概率等。 总结来说,期望dp概率dp的区别在于它们所计算的是不同的值,期望dp计算的是期望值,而概率dp计算的是概率值。 #### 引用[.reference_title] - *1* [概率/期望dp专题](https://blog.csdn.net/qq_34416123/article/details/126585094)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* *3* [【动态规划】数学期望/概率DP/期望DP详解](https://blog.csdn.net/weixin_45697774/article/details/104274160)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值