模式识别课程:
PCA:可以看做一种思想,也是模式识别中常见的不能在常见的一个算法。
1:一个算法到底有没有理解??? 你能通过代码写出来,才说明理解了。
2:PCA(主成分分析)
一般是为了降维,把每个样本对应的n维的特征向量转成仅仅m维的向量。 至于降维后,做分类的事情,就不属于它的范畴了。
(ps:分类的时候可以有多种方法选择:如svm,神经网络。。。)
它不需要知道各个样本到底是什么类型
3:PCA如何编码:分为六步(对啊,老师讲的很清晰。就六步而已,知道这六步就是知道了这个算法。ps:你要是自己看书,看五个小时也不懂写的什么。老师原话)
a:把每个样本表示成 如 20000维的向量
b: 计算样本的平均向量
c;每个样本向量减去平均向量
d:计算协方差矩阵
e;计算协方差矩阵的 特征值和特征向量 ,从大到小?选出前 m 个特征值及其对应的特征向量
f:最后一步忘了???(过两天补上。)
4: 在计算 d,e两步时,如你的矩阵是 20000维的话,如A*A的转置,太大了,计算机处理不了,这时候就要另辟蹊径,简化计算。
如采用 A的转置*A,然后再 经过一步公式变换即可。
ps:具体的参见老师的PCA的课件。