Principal Component Analysis,主成分分析。
协方差:通过协方差的数值大小,可以判断这两个变量同向或反向的程度;
相关系数:协方差除以标准差;
https://www.zhihu.com/question/20852004
总结一下PCA的算法步骤:
设有m条n维数据。
1)将原始数据按列组成n行m列矩阵X
2)将X的每一行(代表一个属性字段)进行零均值化,即减去这一行的均值
3)求出协方差矩阵C=1mXXTC=1mXXT
4)求出协方差矩阵的特征值及对应的特征向量
5)将特征向量按对应特征值大小从上到下按行排列成矩阵,取前k行组成矩阵P
6)Y=PXY=PX即为降维到k维后的数据
参考链接:http://blog.codinglabs.org/articles/pca-tutorial.html
Mat imgSrc = imread("lena.jpg");
cvtColor(imgSrc, imgSrc, COLOR_RGB2GRAY);
normalize(imgSrc, imgSrc, 0, 255, cv::NormTypes::NORM_MINMAX, CV_8UC1);
PCA pca(imgSrc, Mat(), PCA::DATA_AS_COL, 50);
cout << "均值的规格:" << pca.mean.size() << endl;//均值
cout << "特征值的规格:" << pca.eigenvalues.size() << endl;//特征值
cout << "特征向量的规格:" << pca.eigenvectors.size() << endl;//特征向量
Mat imgPCA = pca.project(imgSrc);
Mat imgNew = pca.backProject(imgPCA);
normalize(imgNew, imgNew, 0, 255, cv::NormTypes::NORM_MINMAX, CV_8UC1);
imshow("1", imgSrc);
imshow("2",imgNew);
waitKey();