Pinsker’s inequality(信息散度和变分距离之间的不等式)

最新推荐文章于 2025-05-16 11:50:04 发布

信通天使

最新推荐文章于 2025-05-16 11:50:04 发布

阅读量587

点赞数 1

分类专栏：信息论文章标签：信息与通信概率论

本文链接：https://blog.csdn.net/qq_43602554/article/details/132586540

版权

信息论专栏收录该内容

7 篇文章

订阅专栏

文章目录

Pinsker’s inequality
证明

Pinsker’s inequality

$D\left(P_1 \| P_2\right) \geq \frac{1}{2 \ln 2}\left\|P_1-P_2\right\|_1^2$

证明

二进制

首先证明二进制的情况，考虑两个参数分别为 $\geq q$ 的二进制分布。我们需要证的是：
$\log \frac{p}{q}+(1-p) \log \frac{1-p}{1-q} \geq \frac{4}{2 \ln 2}(p-q)^2$ 不等式两边的差 $g (p, q)$ ：
$\log \frac{p}{q}+(1-p) \log \frac{1-p}{1-q} - \frac{4}{2 \ln 2}(p-q)^2$
对 $q$ 求导得 $\begin{aligned} \frac{d g(p, q)}{d q} & =-\frac{p}{q \ln 2}+\frac{1-p}{(1-q) \ln 2}-\frac{4}{2 \ln 2} 2(q-p) \\\\ & =\frac{q-p}{q(1-q) \ln 2}-\frac{4}{\ln 2}(q-p) \\\\ & \leq 0 \end{aligned}$ 最后一步因为 $\leq 1/4$ ， $q\leq p$ 。
当 $q = p$ 时，有 $g (p, q) = 0$ ，所以当 $q\leq p$ 时候， $\geq 0$ ，不等式得证。

一般的情况

对于任意两个分布 $P_1,P_2$ ，记：
$A=\left\{x: P_1(x)>P_2(x)\right\}$ 定义一个新的二进制随机变量 $Y=\phi(X)$ ，集合 $A$ 的指示器，记 $\hat P_1,\hat P_2$ 是 $Y$ 的分布，是 $P_1,P_2$ 的量化版本。
将data-processing inequality应用到相对熵中得到：
$\begin{aligned} D\left(P_1 \| P_2\right) & \geq D\left(\hat{P}_1 \| \hat{P}_2\right) \\\\ & \geq \frac{4}{2 \ln 2}\left(P_1(A)-P_2(A)\right)^2 \\\\ & =\frac{1}{2 \ln 2}\left\|P_1-P_2\right\|_1^2, \end{aligned}$

变分距离

任意两个分布之间的变分距离定义为：
$\left\|P_1-P_2\right\|_1=\sum_{a \in \mathcal{X}}\left|P_1(a)-P_2(a)\right|$ 记：
$A=\left\{x: P_1(x)>P_2(x)\right\}$ 有
$\begin{aligned} \left\|P_1-P_2\right\|_1 & =\sum_{x \in \mathcal{X}}\left|P_1(x)-P_2(x)\right| \\\\ & =\sum_{x \in A}\left(P_1(x)-P_2(x)\right)+\sum_{x \in A^c}\left(P_2(x)-P_1(x)\right) \\\\ & =P_1(A)-P_2(A)+P_2\left(A^c\right)-P_1\left(A^c\right) \\\\ & =P_1(A)-P_2(A)+1-P_2(A)-1+P_1(A) \\\\ & =2\left(P_1(A)-P_2(A)\right) . \end{aligned}$