本篇文章主要内容来自于Andrew的书,链接为http://ufldl.stanford.edu/tutorial/unsupervised/PCAWhitening/
PCA
PCA也就是主成分分析,是用来降维的一种手段,它可以显著地提高算法的运行速度。
当你在处理图像的时候,输入通常是冗余的,这是因为图像中相邻的像素点往往是关联的,PCA可以用来将图像的原始输入近似为一个更低维度的输入,并且保证误差较小。
对于降维的一个直观理解如下图所示:
原始图像中数据是二维的,但是明显看出数据是近似于某种线性结构的。PCA可以将数据投影到一个一维子空间上。
定义矩阵:
Σ=1m∑i=1m(x(i))(x(i))