1:为什么图像处理需要PC A?
1- 如果【特征向量】维度过高,不仅会增加计算复杂度,还会给分类问题带来负面影响,造成识别,或者分类精度降低。
2- 可能,直观上,感觉特征越多,就越多的描述【样本的属性】,可提高识别率。
3- 其实,并不是???!!
假设,要区分西瓜,冬瓜。我们可以直接通过表皮就纹理,就可以做出正确的判断。那么,我多加几个特征:(重量)(形状)(体积)(是否有籽),可能还会对分类造成干扰。
:实际上,对于【特定样本数目】的情况下,特征维度与识别率关系 大概如下曲线:
注意:x轴—特征向量数目, y轴—分类性能。
这就需要对【特征降维】,其中一个重要手段:PCA.
2: PCA 干什么?
【实质】:尽可能好的保留原始数据信息的条件下,通过【线性变换】将高维空间中样本数据投影到低维空间。
3: PCA怎么干?数学解释
1- 提取 样本协方差矩阵S 的 前K个特征值【求矩阵特征值,然后排序,然后取前K个】对应的特征向量【这些特征向量保证相互正交】。
2- 实际上,就是找到一组基,将原来的矩阵投影到新的 空间上。
3- 几何解释
1- 在二维平面,求出来的两个本征向量就是,E1,E2. PCA实际上做:投影变换【从原来的X,Y轴,转换