Darmois-Skitovic定理证明

最新推荐文章于 2022-09-07 20:46:22 发布

Jie Qiao

最新推荐文章于 2022-09-07 20:46:22 发布

阅读量629

点赞数 1

分类专栏：人工智能

本文链接：https://blog.csdn.net/a358463121/article/details/110505572

版权

人工智能专栏收录该内容

51 篇文章 16 订阅

订阅专栏

DS定理在ICA上有着很重要的作用：
独立成分分析FastICA算法原理
本文给出了DS定理的证明。

引理1 设 $\displaystyle f_{1} ,...,f_{N}$ 可导，并且
$f_{1} (a_{1} x+b_{1} y)+f_{2} (a_{2} x+b_{2} y)\cdots +f_{N} (a_{N} x+b_{N} y)=A(x)+B(y)\ \ \forall x,y$
其中 $\displaystyle a_{1} ...a_{N} ,b_{1} ,...,b_{N}$ 是非0常数，而且满足：

$a_{i} b_{j} -a_{j} b_{i} \neq 0,\forall i\neq j$

则所有函数 $\displaystyle f_{i}$ 一定是多项式且最多只有N阶。

证明：
我们考虑第N个函数，显然，肯定存在一个变换

$\left. \begin{array}{ c } x\leftarrow x+\delta ^{(1)}_{1}\\ y\leftarrow y+\delta ^{(1)}_{2} \end{array}\right.$

使得 $\displaystyle a_{N} x+b_{N} y$ 的值不变，也就是说

$a_{N} x+b_{N} y=a_{N} x+a_{N} \delta ^{(1)}_{1} +b_{N} y+b_{N} \delta ^{(1)}_{2}$

这意味着

$a_{N} \delta ^{(1)}_{1} +b_{N} \delta ^{(1)}_{2} =0$

而对于其他的项，因为 $\displaystyle a_{i} b_{j} -a_{j} b_{i} \neq 0$ 那么他们一定是会发生变化的，即 $\displaystyle f_{i}\left( a_{i}\left( x+\delta ^{(1)}_{1}\right) +b_{i}\left( y+\delta ^{(1)}_{y}\right)\right) -f_{i}( a_{i} x+b_{i} y) =\epsilon >0$ 。为什么呢？可以想象一下，不变化的条件是什么？如果要不变化，那么其他项的系数一定要满足：

$a_{N} \delta ^{(1)}_{1} +b_{N} \delta ^{(1)}_{2} =0\\ a_{i} \delta ^{(1)}_{1} +b_{i} \delta ^{(1)}_{2} =0$

换句话说：

$a_{N} \delta ^{(1)}_{1} +b_{N} \delta ^{(1)}_{2} =0\\ a_{i} \delta ^{(1)}_{1} +b_{i} \delta ^{(1)}_{2} =0\\ \Longrightarrow \frac{a_{N}}{b_{N}} =\frac{a_{i}}{b_{i}} =\frac{\delta ^{(1)}_{1}}{\delta ^{(1)}_{2}}$

然后这是不可能的，因为 $\displaystyle a_{i} b_{j} -a_{j} b_{i} \neq 0$ .

因此，进行一阶差分，我们可以得到：

$\left. \begin{array}{ c } \Delta _{\epsilon ^{(1)}_{1}} f_{1} (a_{1} x+b_{1} y)+\Delta _{\epsilon ^{(1)}_{2}} f_{2} (a_{2} x+b_{2} y)\cdots +\Delta _{\epsilon ^{(1)}_{N-1}} f_{N-1} (a_{N-1} x+b_{N-1} y)\\ =A_{1} (x)+B_{1} (y)\ \ \forall x,y \end{array}\right.$

其中

$\Delta _{h} f(x)=f( x+h) -f( x)$

比如，对于

$\Delta _{\epsilon ^{(1)}_{1}} f_{1} (a_{1} x+b_{1} y)=f_{1} (a_{1} x+b_{1} y+\underbrace{a_{1} \delta ^{(1)}_{1} +b_{1} \delta ^{(1)}_{2}}_{\epsilon ^{(1)}_{1}} )-f_{1}( a_{1} x+b_{1} y)$

注意到，显然第N项消失了，类似地，我们对N-1项做一次二阶差分，那么N-1项也会消失，直到

$\Delta _{\epsilon ^{(N-1)}_{1}} ...\Delta _{\epsilon ^{(2)}_{1}} \Delta _{\epsilon ^{(1)}_{1}} f_{1} (a_{1} x+b_{1} y)=A_{N-1} (x)+B_{N-1} (y)\$

接来下，我们分别令x变，y不变，做一次差分：

$\Delta _{\epsilon ^{(N)}_{1}} \Delta _{\epsilon ^{(N-1)}_{1}} ...\Delta _{\epsilon ^{(2)}_{1}} \Delta _{\epsilon ^{(1)}_{1}} f_{1} (a_{1} x+b_{1} y)=A_{N} (x)$

然后令x不变y边做一次差分

$\Delta _{\epsilon ^{(N+1)}_{1}} \Delta _{\epsilon ^{(N)}_{1}} \Delta _{\epsilon ^{(N-1)}_{1}} ...\Delta _{\epsilon ^{(2)}_{1}} \Delta _{\epsilon ^{(1)}_{1}} f_{1} (a_{1} x+b_{1} y)=0$

最终我们发现，对于任意的x,y, $\displaystyle f_{1}$ 在N+1次差分后变成了0（这等价于N+1次求导），这意味着 $\displaystyle f_{1}$ 一定是一个多项式函数，而且最多只有 $\displaystyle N$ 阶.
证毕。

在这里插入图片描述
定理1说明了高斯分布只能由高斯分布相加产生，不可能存在其他分布。（这个与中心极限定理是有点“冲突”。不过实际上，当相加的分布是有限的时候，这个定理是一定成立的）

在这里插入图片描述
第二个定理是说明了，如果特征函数满足指数项是多项式的时候，只有高斯分布的随机变量满足。也就是说，如果存在特征函数是 $e^{P(w)}$ 形式的变量，那 $P (w)$ 一定是小于或等于2阶多项式。

在这里插入图片描述

最后就是我们要证明的DS定理了。首先，对于那些 $a_ib_i=0$ 的项，我们是可以忽略的，因为这意味着 $X_i$ 只出现在一边，所以并不会影响 $Y$ 的独立性。所以我们重点还是考虑 $Y$ 中的 $a_ib_i\ne0$ 项。

证明：
首先，我们可以设 $a_ib_j-a_jb_i\ne 0 \to \frac{a_i}{a_j}\ne \frac{b_i}{b_j}$ ，换句话说，没有等比例的两个 $X_i,X_j$ ，如果有的话，我们完全可以把他们合并成一个随机变量，然后定义一个新的。（那如果这个新的变量是高斯分布，根据L´evy-Cramer定理，合并的这两个变量也是高斯的，所以这并不会影响我们的证明，尽管可以只能证出这个合并后的变量是高斯的，只要 $ab\ne 0$ ）

首先一个随机变量的特征函数可以写作

$\Phi _{X} (\omega )=E\{e^{j\omega X} \}$

于是对于 $\displaystyle Y_{1} ,Y_{2}$ 的特征函数为，

$\begin{aligned} \Phi _{Y_{1} ,Y_{2}} (\omega _{1} ,\omega _{2} ) & =E\left\{e^{j\omega _{1} Y_{1} +j\omega _{2} Y_{2}}\right\}\\ & =E\left\{e^{j\sum ^{N}_{i=1}( \omega _{1} a_{i} +b_{i} \omega _{2}) X_{i})}\right\}\\ & =\Phi _{X_{1}} (a_{1} \omega _{1} +b_{1} \omega _{2} )\Phi _{X_{2}} (a_{2} \omega _{1} +b_{2} \omega _{2} )...\Phi _{X_{N}} (a_{N} \omega _{1} +b_{N} \omega _{2} ) \end{aligned}$

最后一个等式是因为 $\displaystyle X$ 是相互独立的，所以他们的特征函数可以分解。然后又因为 $\displaystyle Y_{1} ,Y_{2}$ 是独立的，所以

$\Phi _{Y_{1} ,Y_{2}} (\omega _{1} ,\omega _{2} )=\Phi _{Y_{1}} (\omega _{1} )\Phi _{Y_{2}} (\omega _{2} )$

于是

$\Phi _{X_{1}} (a_{1} \omega _{1} +b_{1} \omega _{2} )\Phi _{X_{2}} (a_{2} \omega _{1} +b_{2} \omega _{2} )...\Phi _{X_{N}} (a_{N} \omega _{1} +b_{N} \omega _{2} )=\Phi _{Y_{1}} (\omega _{1} )\Phi _{Y_{2}} (\omega _{2} )$

两边取log

$\psi _{X_{1}} (a_{1} \omega _{1} +b_{1} \omega _{2} )+\psi _{X_{2}} (a_{2} \omega _{1} +b_{2} \omega _{2} )+...+\psi _{X_{N}} (a_{N} \omega _{1} +b_{N} \omega _{2} )=\psi _{Y_{1}} (\omega _{1} )+\psi _{Y_{2}} (\omega _{2} )$

这个就是我们的引理1了，根据引理1， $\displaystyle \psi _{X_{i}}$ , $\displaystyle \psi _{X_{j}}$ 一定是一个多项式函数，根据Marcinkiewics-Dugue定理， $\displaystyle X_{i} ,X_{j}$ 一定是高斯分布（因为他取了log之后是多项式，所以其指数项是多项式）