PCA变换有几个问题一直想不明白,到写这篇博文的时候也想不明白,原理和初衷的问题,分享如下
把一摞数据的协方差单纯累加起来,就能计算反应出整个数据各个维度相互关系的变量来?
为什么从协方差推出来的:特征向量和特征值,就可以直接用到源数据上面进行变换操作了? 特征向量和特征值是个什么东西?
PCA变换的恢复问题?
PCA变换Z=U.T*X(Z是变换后数据,X是源数据,U是变换矩阵) 但是逆变换直接就是X=U*Z了,这是为什么?
按照常理来看,如果U包含所有的特征变换矩阵,Z=U.T*X,那么X=inverse(U)*Z,且这个时候的X跟我们原始数据X是一样的,因为根本没有信息损失.而且很重要的一点,由于特征变换矩阵这个是正交阵,因此inverse(U)=U.T 求逆就是求他的转置。
这个时候我们再来想只包含几个特征向量的特征变换矩阵的PCA反变换的情况,这个时候