独立成分分析ICA

最新推荐文章于 2024-07-11 09:39:50 发布

vendetta_gg

最新推荐文章于 2024-07-11 09:39:50 发布

阅读量1.3k

点赞数 2

文章标签：算法信号处理

本文链接：https://blog.csdn.net/vendetta_gg/article/details/106495639

版权

独立成分分析ICA

by：Yang Liu

1.ICA（independent component analysis）的定义：利用很少的先验知识将混合信息分离成独立分量的一种重要方法。目的是找到一组分量，此分量应该最大化独立，进而发现数据中一些隐藏的信息。
2.ICA的经典模型：
“鸡尾酒会”的问题，人的大脑从嘈杂的酒会中快速的区分出自己想要的声音。
在这里插入图片描述
${X_j} = {A_{{\text{j}}1}}{S_1} + {A_{{\text{j2}}}}{S_2} + {A_{{\text{j3}}}}{S_3}... + {A_{{\text{jn - 1}}}}{S_{n - 1}} + {A_{{\text{jn}}}}{S_n}$
矩阵形式 ${X} = {A}{S}$ 其中X是已知的，A和S是未知的；目标是通过X来估计出A和S。
模型中的两个不确定因素：
（1）输出向量排列顺序的不确定性，即无法确定所提取的信号对应原始信号源的哪一个分量；
（2）输出信号幅度的不确定性，即无法恢复到信号源的真实幅度。
因为有两个未知量，所以为了使ICA模型能被估计则我们需要提出假设前提和条件，如下：
（1）独立成分被假定为是统计独立的。
ICA成立的前提；也就是说S中的各个随机变量独立，从统计学角度看，就是联合概率密度等于边缘概率密度的乘积。
$P({X_1},{X_2}) = P({X_1})P({X_2})$
$E({X_1},{X_2}) = E({X_1})E({X_2})$
独立肯定不相关，不相关不一定独立，因为不相关一般所指仅是在线性领域，即独立是比不相关更强的约束。在PCA中各个分量是不相关的，在ICA中各个分量是独立的。总的来说，ICA认为观测信号是若干个统计独立的分量的线性组合，ICA要做的是一个解混过程。而PCA是一个信息提取的过程，将原始数据降维，现已成为ICA将数据标准化的预处理步骤。
（2）独立成分是非高斯分布。
如果观测到的变量是高斯分布（正态分布），那么ICA是不可能实现的,我们无法恢复出唯一的S，因为高斯分布中的各个方向是等价的。
两个均服从高斯分布的联合概率密度是 $P({X_1},{X_2}) = \frac{1}{{2\pi }}\exp ( - \frac{{X_1^2 + X_2^2}}{2})$
在这里插入图片描述
从图像中可知联合概率密度没有边缘信息，也可以说没有A的列向量信息。
可以认为越接近高斯分布独立性越差，反之，越远离高斯分布，独立性越强。根据中心极限定理有，独立随机变量的和在一定条件下趋于高斯分布，即独立随机变量的和比独立随机变量更趋于高斯分布。
（3）假定混合矩阵A是方阵。
也就是说，X变量的个数和S中变量的个数相同。因为要对A求逆矩阵，所以A一定为方阵。
3.寻找独立成分的方法：
固定点算法（fastICA）
（1）涉及的数学原理
牛顿迭代法：
在这里插入图片描述
熵：
对一个离散取值的随机变量变量X，其熵H的定义为： $\sum {P({x_i})\log (P({x_i}))}$ 其中 ${{x_i}}$ 是X的可能取值，P是取值的概率。
对一个连续取值的的随机变量X，熵H的定义为： $\int_a^{\text{b}} {P(X)\log P(X)d{\text{x}}}$ ,称为微分熵。随机变量越随机其熵越大。
负熵：
${N_{\text{g}}}(Y) = H({Y_G}) - H(Y)$ 式中， ${Y_G}$ 是与Y具有相同方差的高斯随机变量。在具有相同方差的随机变量中，高斯随机变量具有最大的微分熵，当随机变量服从高斯分布时负熵为零，也就是说随机变量非高斯型越强，其微分熵越小负熵越大，所以可以根据负熵的大小，判定随机变量的非高斯性。
归一化：
将观测数据X归一化，即减去其均值m=E{x}使其具有零均值。
白化：
若一个零均值的随机变量Z，满足 $E(Z{Z^T}) = I$ ,其中I是单位矩阵，我们称Z为白化向量，白化的本质是去相关，这和PCA的目的是一样的。白化数据的一般方法是，对数据协方差进行特征值分解，
${x^1} = E{D^{ - \frac{1}{2}}}{E^T}X$ ,其中E是协方差矩阵的特征向量的正交阵，D是协方差矩阵特征值的对角矩阵。
白化使我们需要确定的参数减少了一般，因为原矩阵的自由度是 ${n^2}$ ,白化后所得正交矩阵的自由度是 $\frac{{n(n - 1)}}{2}$ 。
白化后的X有 $E(X{X^T}) = I$ ,I是单位矩阵。因为有约束 $E\{ {S_{\text{i}}}^2\} = 1$ ，所以变换后的A为正交矩阵。
FastICA迭代算法:
$x = A s$ , $s = {A^{ - 1}}x$ ,
另 ${W^T}X.Z = {A^T}W,Y = {W^T}X = {W^T}As = {Z^T}{\text{s}}$
此时Y是s的线性组合，Y比s更具有高斯性，当Y等于s时，Y具有最大非高斯性。
ICA要做的就是就是要找到一个最优方向，使此方向的非高斯性最大，也就是负熵最大，
${J_{\text{g}}}(Y) = H({Y_G}) - H(Y)$ ，
在fastICA中的近似算法为
$J(Y) = {\{ E\{ G(Y)\} - E\{ G(V)\} \} ^2}$ ,
E(.)表示均值运算，G(.)表示非线性函数，V是均值为零方差为1的高斯随机变量。
常取 ${G_1}({\text{u}}) = \frac{1}{{{a_1}}}\log \cos {a_1}u,{G_2}(u) = - \exp ( - \frac{{{u^2}}}{2})$ 。
导数为 ${g_1}(u) = \tanh ({a_1}u),{g_2}(u) = u\exp ( - \frac{{{u^2}}}{2})$ 。g(.)表示为G(.)的导数。
${a_1}$ 属于[1,2]中的一个合适常量，一般 ${a_1}$ 取1。
因为S和A是未知的所以S乘以一个标量K，A总能乘以一个1/K来抵消，即不能唯一确定S和A,因此做如下约束 $E\{ {S_{\text{i}}}^2\} = 1$ ,既有 $E\{ {({W^T}X)^2}\} = ||W|{|^2} = 1$ ,在此约束条件下， $E\{ G({W^T}X)\}$ 的最适条件可通过 $E\{ X{\text{g}}{(W^T}X)\} - \beta W = 0$ 来获得。
用牛顿法解此方程，定义左侧为F，则其雅克比矩阵J{F(W)}为:
$J\{ F(W)\} = E\{ X{X^T}{g'}({W^T}X)\} - \beta I$
上式右侧第一项可化简为：
$E\{ X{X^T}g'({W^T}X)\} = E(X{X^T})E\{ g'({W^T}X)\} = E\{ g'({W^T}X)\} I$ ,则雅克比矩阵变成对角可逆的;
牛顿迭代公式有： ${W^ + } = W - \frac{{E\{ Xg({W^T}X)\} - \beta W}}{{E\{ g'({W^T}X)\} - \beta }}$ ,

化简有 ${W^ + } = E\{ Xg({W^T}X)\} - E\{ g'({W^T}X)\} W$
综上一次fastICA的算法形式为：
1.初始化向量W；
2.令 ${W^ + } = E\{ Xg({W^T}X)\} - E\{ g'({W^T}X)\} W$ ；
3.令 $\frac{{{W^ + }}}{{||{W^ + }||}}$ ;
4.若W没有收敛，则回到2。收敛意味着前后两次W在同一方向上，且3步把W单位化了，所以点积为1。（简单的说，收敛就是输入和输出差别很小。）
一次算法估计出一个W值，为了得到若干个值，则需进行若干次算法，为了防止所得到的结果收敛在同一最大值，需要对每一次的输出 ${W^T}X$ 去相关。
使用Gram-Schmidt去相关，因为向量的点积为1，所以有：
${W_{p + 1}} = {W_{p + 1}} - \sum\limits_{i = 1}^p {({W_{P + 1}},{W_i}){W_i}}$
${W_{p + 1}} = \frac{{{W_{p + 1}}}}{{||{W_{P + 1}}||}}$

参考文献：
1.https://wenku.baidu.com/view/9af7eb115f0e7cd1842536e9.html?sxts=1591069811772
2.https://blog.csdn.net/ctyqy2015301200079/article/details/86705869
3.https://www.zhihu.com/topic/20658238/hot
4.https://blog.csdn.net/qq_44945010/article/details/89413446
5.https://wenku.baidu.com/view/ad92875a112de2bd960590c69ec3d5bbfc0ada0f.html
6.https://wenku.baidu.com/view/ebb635bf9a89680203d8ce2f0066f5335a8167d6.html