要容易理解ICA,就需要先好好理解透彻下面这些概率统计和线性代数的知识点:高斯分布、概率密度函数、累积分布函数、复合函数的概率密度函数、行列式、代数余子式、矩阵微积分等。下面一一简单记录和复习下这些概念,俗话说书读百遍其义自见,这里再多写一遍也不为过。
1.ICA概念
Independent Component Correlation Algorithm,ICA,独立成分分析算法,是一种函数。
X为n维观测信号矢量,S为独立的m维未知源信号矢量,矩阵A被称为混合矩阵。
ICA的目的就是寻找解混矩阵W(W=A的逆矩阵),然后对X进行线性变换,得到输出向量U = WX = WAS
主要应用于:表情分类
ICA详细的计算过程的原理推理,详见后面文章:点我
2.高斯分布
2.1名称
Normal Distribution,正态分布,也称常态分布,又名高斯分布(Gaussian Distribution)。是一个在数学、物理及工程等领域都非常重要的概率分布。
2.2正态分布
若随机变量X服从一个数学期望μ,方差为σ^2的正态分布,则记作N(μ,σ^2)。
随机变量X的概率密度函数为:μ决定了其位置,标准差σ决定了分布的幅度。
2.3标准正态分布
当μ=0,σ=1时的正态分布为标准正态分布。
2.4正态分布<--->标准正态分布
为了便于描述和应用,将正态变量X作为数据转换,将一般正态分布转化为标准正态分布: