Pinsker‘s Inequality 证明

防盗:https://blog.csdn.net/qq_21149391/article/details/126844824?spm=1001.2014.3001.5502

1. Statement:

\sum_{i=1}^{n}p_i \log \frac{p_i}{q_i} \geq \frac{1}{2}\left ( \sum_{i=1}^{n}|p_i-q_i| \right )^2

其中, 不等号左侧等价于 D_{\rm KL}(P||Q), 关于 KL散度可以看这篇介绍: KL Divergence 与 JS Divergence.

不等号右侧等价于  2||P-Q||_{\rm TV} ^2, 其中 ||P-Q||_{\rm TV} 是分布PQ之间的Total Variation Distance, 记为 TV 距离, 关于 TV 距离可以看这篇的介绍: Total Variation Distance 总变差 - 知乎

需要注意的是不等式右侧的常数 \frac{1}{2} : 当 KL 散度中的 log 是以 e 为底时, 这个常数为 \frac{1}{2}; 当 KL 散度中的 log 是以 2 为底时, 这个常数为 \frac{1}{2 \ln 2}, 所以我们在网上会看到不同形式的 Pinsker’s Inequality.

2. 证明:

首先给出2.1的结论, 然后使用这个结论进行证明

2.1 KL散度的链式法则(Chain rule for KL divergence)

D_{KL}(P(X,Y)||Q(X,Y))=\sum_{x,y} p(x,y)\log\frac{p(x,y)}{q(x,y)}\\ =\sum_{x,y} p(x)q(y|x) [\log \frac{p(x)}{q(x)}+\log \frac{p(y|x)}{q(y|x)}]\\ =\sum_x p(x)\log \frac{p(x)}{q(x)}\sum_y p(y|x) + \sum_x p(x) \sum_y p(y|x)\log\frac{p(y|x)}{q(y|x)}\\ =D_{KL}(P(X)||Q(X))+\sum_xp(x)D_{KL}(P(Y|X=x)||Q(Y|X=x))\\ =D_{KL}(P(X)||Q(X)) + D_{KL}(P(Y|X)||Q(Y|X))

如果 P(X,Y)=P_1(X)P_2(Y)Q(X,Y)=Q_1(X)Q_2(Y), 那么有

D_{KL}(P(X,Y)||Q(X,Y))=D_{KL}(P_1(X)||Q_1(X))+D_{KL}(P_2(Y)||Q_2(Y))

.

2.2 证明

Pinsker 定理等价于:

P, Q 是定义在 universe U 上的两个分布, 那么

D_{KL}(P||Q)\geq \frac{1}{2}||P-Q||_1^2

证明:

1) a special case

P=\left\{\begin{matrix} 1 & w.p. & p \\ 0 & w.p. & 1-p \end{matrix}\right. \;\;\;\;\;\;Q =\left\{\begin{matrix} 1 & w.p. & q \\ 0 & w.p. & 1-q \end{matrix}\right.

假设 p>>q, 令

f(p,q)=p\log \frac{p}{q}+(1-p)\log\frac{p}{q} - \frac{1}{2}(2(p-q))^2

p=q时, \frac{\partial f}{\partial q}\leq 0, 且f=0, 所以当q\leq p, 有f\geq 0

2) a general case

令 A\subset U, 且 A=\{x|p(x)\leq q(x)\}, 且: 

P_A=\left\{\begin{matrix} 1 & w.p. & \sum_{x\in A}p(x) \\ 0 & w.p. & \sum_{x \notin A}p(x) \end{matrix}\right. \;\;\;\;\;\;Q_A =\left\{\begin{matrix} 1 & w.p. & \sum_{x \in A}q(x) \\ 0 & w.p. & \sum_{x \notin A}q(x) \end{matrix}\right.

那么:

||P-Q||_1 = \sum_x |p(x)-q(x)|=||P_A-Q_A||_1

 ---- (1).

定义一个随机变量 Z, 且 Z 满足: 

Z=\left\{\begin{matrix} 1 &, & if \;\; x \in A\\ 0 & , & if \;\; x \notin A \end{matrix}\right.

有:

D_{KL}(P||Q)=D_{KL}(P(Z)||Q(Z))+D_{KL}(P||Q|Z)

因为:

D_{KL}(P(Z)||Q(Z)) = D(P_A||Q_A)

 且 

P(P||Q|Z)\geq 0

结合(1)和special case有:

D_{KL}(P||Q)\geq D_{KL}(P_A||Q_A)\geq \frac{1}{2}||P_A-Q_A||_1^2\geq \frac{1}{2}||P-Q||_1^2

  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Manigoldo_

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值