图像识别很有意思的说.
先大概介绍下PCA
PCA(Principle Component Analysis)就是在N维度数据中找出它的最大分布向量和值
举个例子,看下图
不要管红色的数据
蓝色的是我们的数据,它的最大分布向量就是数据最分散的轴,大概30度的样子
我们将所有数据映射到这个轴上面(x轴与y轴无视掉),这样做我们便把2维度数据便变成了1维,
这就是降维的一种常见方法..
同样的PCA也可以分析多维数据.
PCA分析数据的时候, 可以找到多个主向量,比如上面那个图,第一个主向量也就是分布最大的向量,30度的那个
如果原始数据是X形的,那么第二个主成分向量便是X的另一个(较短的)边了.
想在想象一个橄榄球.
如果将它降低到二维我们就会找出他的最大分布面,然后吧所有的点映射到这个面上
映射之后变成了一个椭圆形(不是圆形)
想想如何将PCA应用到图像识别呢?
为了想象方便,先举个简单的例子(只是方便你想像,不一定算出的结果和我说的一样)
首先将一个1*3像素图像处理成灰度图,那么
这个图就有3个0-255灰度组成的像素.
3个像素你便可以想象成x,y,z轴,
ok现在第一个像素x的值是255
第二个像素y的值是0
第三个像素z的值是0
PCA之后的第一个主成分向量便是x轴,值为255,对吧?
一个400*400像素的图呢?
那么就会有160000个坐标轴,160000个维度
主成分分析后也能够找出它的主成分向量和值
</