原文地址:点击打开链接
和维度灾难的作者是同一个作者,可惜只写了降低维度的这一个方法。
1 简介
在这篇文章中,我们讨论了主成分分析是如何工作的,以及为什么它能够作为分类的降维方法。文章末尾展示了matlab源代码。
在之前一篇文章中我们讨论了维度灾难,以及在高维空间中,分类器容易发生过拟合。因此产生了问题:应该选择和舍弃哪些特征。
如果所有的特征都统计意义上相互独立,那么我们可以直接删除那些识别力差的特征向量。这些向量的筛选可以通过各种贪心算法
点击打开链接计算。然而,在现实中许多特
征都是彼此相关或者彼此与某未知的变量相关。因此,一个变量可以表达多重变量的信息。移除这样的变量会失去更多信息。下面两段内容,我们会将pca作为降维方法来讨论,
并且从两方面讨论它的内部工作机制。