最大熵下的概率分布

最新推荐文章于 2024-05-07 14:34:16 发布

MATLAB卡尔曼

最新推荐文章于 2024-05-07 14:34:16 发布

阅读量996

点赞数

文章标签：信息熵拉格朗日乘子法概率论

本文链接：https://blog.csdn.net/callmeup/article/details/118769295

版权

研究生课程专栏收录该内容

13 篇文章 8 订阅

订阅专栏

背景

本文为研究生课程里面的一个作业，题目自选，最后老师也没有让我们提交，所以传上来给大家参考、相互学习，如有疑问请联系850051568@qq.com

题目

已知某随机分布满足的约束条件如下式：
$s.t.\left\{ \begin{aligned} x &\ge 0 \\ E(x)&=\frac{1}{\mu} \end{aligned} \right.$
求使得熵最大的概率分布。

问题分析

本题要求依据所测量得到的数据及由其构成的约束条件下，按最不确定性，即使熵最大化的原则求取概率分布。求解思路为：根据最大熵发求解概率分布的数学模型采用拉格朗日(Lagrange)乘子法来解析求解，根据KKT条件，可得最优解。

理论介绍

信息熵的物理含义为某一信号不确定性的度量，数学公式为： $I(x_i)=-\log p(x_i)$ .连续随机变量X的熵的物理含义是：某个信源的总体平均不确定性的度，数学公式为： $H(X)=-\int_R p(x)\log p(x)dx$ .

最大熵发求解概率分布的数学模型为：
$\max \left(-\int_{S} p(x) \log p(x) d x \mid \text { s.t }\left\{\begin{aligned} -p(x) &\leq 0 \\ \int_{S} p(x)&=1 \\ \int_{S} p(x) f_{i}(x) d x&=a_{i},(i=1,2,3, \ldots, n) \end{aligned}\right)\right.$

代入拉格朗日(Lagrange)乘子法方程，可得式：
$\lambda)=\int_{S} p \log p d x-\mu_{-1} p+\mu_{0}\left(\int_{S} p d x-1\right)+\sum_{j=1}^{n} \lambda_{j}\left(\int_{S} p f_{j} d x-a_{j}\right).$
根据KKT条件对上式求导=0，可得最优解
$\frac{\partial L}{\partial p}=\ln p+1-\mu_{-1}+\mu_{0}+\sum_{j=1}^{n} \lambda_{j} f_{j}=0$
进而得：
$\begin{aligned} p&=e^{-1+\mu_{-1}-\mu_{0}-\sum_{j=1}^{n} \lambda_{j} f_{j}}\\ &=C^* e^{-\sum_{j=1}^{n} \lambda_{j}^{*} f_{j}(x)}\\ &=C^* e^{-\lambda_{1}^* f_1(x)-\lambda_{2}f_2(x)-\dots}\\ &=p^* \end{aligned}$

题目求解

由最优解标准式和已知约束，可知满足最大熵概率形式为：
$\left.\begin{array}{l} p(x)=c e^{-\lambda_{1} f_{1}(x)-\lambda_{2} f_{2}(x)-\ldots} \\ \text { s.t. } \left\{\begin{aligned} x &\ge 0 \\ E(x)&=\frac{1}{\mu} \end{aligned} \Rightarrow \begin{aligned} f_{1}(x)&=x \\ f_{2}(x)&=x \end{aligned}\right. \end{array}\right\} \Rightarrow p(x)=\left\{\begin{aligned} c e^{-(\lambda_{1}+\lambda_{2}) x}&,x \ge 0\\ 0&,others \end{aligned}\right.$
根据概率满足的固有条件和题目所给条件： $\left\{\begin{aligned} \int _0^{+\infty}p(x)dx&=1\\ \int _0^{+\infty}xp(x)dx&=\frac{1}{\mu} \end{aligned}\right.$
上述2式联立，得：
$\left\{\begin{aligned} c\int _0^{+\infty}e^{-(\lambda_{1}+\lambda_{2}) x}dx&=1\\ c\int _0^{+\infty}xe^{-(\lambda_{1}+\lambda_{2}) x}dx&=\frac{1}{\mu} \end{aligned}\right.$
将 $\lambda_{1}$ + $\lambda_{2}$ 视为一个整体， $c$ 为未知量， $\mu$ 为已知量，2个方程接2个未知量，解得：
$\left\{\begin{aligned} c&=\mu\\ \lambda_{1}+\lambda_{2}&=\mu \end{aligned}\right.$
综上，可得求得的熵最大概率分布为：
$p(x)=\left\{\begin{aligned} \mu e^{-\mu x},x \ge 0\\ 0,others \end{aligned}\right.$ ,是一个系数为 $\mu$ 的指数分布。

总结

输出信号自变量非负时，输出信号的概率密度函数是指数分布时熵最大。
用拉格朗日乘子法求解有约束的最小化数学模型时，约束、表达式、变量(待求变量)是三要素，缺一不可。
(自)信息量用于反映信号的不确定性，当前信号存在的概率越低，其不确定性就越高，所以对应的信息熵就越大。信息量越大，表示先验不确定性和后验不确定性的差值越大。

MATLAB卡尔曼

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
打赏
2
评论
最大熵下的概率分布

背景本文为研究生课程里面的一个作业，题目自选，最后老师也没有让我们提交，所以传上来给大家参考、相互学习，如有疑问请联系850051568@qq.com题目已知某随机分布满足的约束条件如下式：s.t.{x≥0E(x)=1μ s.t.\left\{ \begin{aligned} x &\ge 0 \\ E(x)&=\frac{1}{\mu} \end{aligned} \right. s.t.⎩⎪⎨⎪⎧xE(x)≥0=μ1求使得熵最大的概率分布。问
复制链接

扫一扫