2DPCA—二维主成分分析详解及编程

最新推荐文章于 2024-05-22 21:20:48 发布

置顶翻滚的石子

最新推荐文章于 2024-05-22 21:20:48 发布

阅读量9.2k

点赞数 11

分类专栏：特征提取文章标签：机器学习线性代数

本文链接：https://blog.csdn.net/qq_38962956/article/details/105091878

版权

特征提取专栏收录该内容

2 篇文章 0 订阅

订阅专栏

第一幅插图是对此篇文章的总结，建议看完文章以后再行观看。本文主要参考了《Two-Dimensional PCA:A New Approach to Appearance-Based Face Representation and Recognition》

一、为什么提出2DPCA（Why）

PCA存在着以下问题：

1、使用PCA进行图像分类识别时，需要将二维矩阵转换为一维向量，使得图像内在的结构信息丢失。

2、使用PCA学习特征向量时，由一维向量构造的协方差矩阵尺寸过大，计算复杂度高。

3、由于训练样本数量较少，协方差矩阵尺寸过大，因此PCA容易导致过拟合问题。

因此考虑直接使用二维图像构造协方差矩阵，计算投影轴（特征向量），并直接使用二维图像进行投影获得图像的模式特征。

二、2DPCA数学公式（What）

（一）模型

使用 $\left \{ A_{1},A_{2},...,A_{N} \right \}$ 表示N个二维图像，图像尺寸为 $m\times n$ ，2DPCA旨在使用二维图像计算维标准正交列向量作为投影轴，实现如下的特征提取：

Y=AX

其中为二维图形投影后得到的新特征，大小为维。

（二）策略（优化目标）

那么如何度量投影轴或者投影后特征？引入投影后特征的总散射，即投影后特征构造的协方差矩阵的迹，进行衡量。其定义如下：

J(X)=trace(S)

其中表示投影后特征构造的协方差矩阵， J(X) 表示协方差矩阵的迹。根据协方差的性质，我们的目标是最大化 J(X) ：

$\underset{X\in R^{n}}{arg\;max}\;J(X)$

由于我们往往计算多个投影轴，因此将上述优化公式广义化为求取个特征向量：

$\begin{aligned} &{X_{1},X_{1},...,X_{k}}={arg\;max}\;J(X)\\ &X_{i}^{T}X_(j)=0,i\neq j \end{aligned}$

接下来进行 J(X) 的公式推导。

首先计算投影后特征构造的协方差矩阵，表示如下：

$\begin{aligned} S&=E\left \{ (Y-\overline{Y} )(Y-\overline{Y} )^{T}\right \} \\ &=E\left \{ (AX-\overline{A}X)(AX-\overline{A}X)^{T} \right \}\\ & =E\left \{ [(A-\overline{A})X] [(A-\overline{A})X]^{T}\right \} \end{aligned}$

根据上式，可以根据以下公式 J(X) ：

$J(x)=trace(S)=X^{T}{E[(A-\overline{A})^{T}(A-\overline{A})]X$

定义图像协方差矩阵如下：

$\begin{aligned} G&=E[(A-\overline{A})^{T}(A-\overline{A})] \\ &= \frac{1}{M}\sum_{i=1}^{N}(A_{i}-\overline{A})^{T}(A_{i}-\overline{A}) \end{aligned}$

显而易见，图像协方差矩阵是直接使用N个二维图像直接构建，尺寸为n*n。

（三）算法（如何计算投影向量）

此时有 $J(X)=X^{T}GX$ ，因此寻找最大化 J(X) 的维列向量转换为求取图像协方差矩阵的特征向量。

1、载入所有二维图像矩阵 $\left \{ A_{1},A_{2},...,A_{N} \right \}$ ，计算平均图像 $\overline{A}=\frac{1}{N}\sum_{i=1}^{N}A_{i}$ ；

2、对所有二维图像进行中心化处理，计算图像协方差矩阵 $G= \frac{1}{M}\sum_{i=1}^{N}(A_{i}-\overline{A})^{T}(A_{i}-\overline{A})$ ；

3、计算图像协方差矩阵的特征向量和特征值，选择前个最大特征值以及对于特征向量组成投影矩阵。

（四）特征提取和图像重构

假设图像矩阵为，尺寸为 $m\times n$ ；对应前个最大特征值的特征向量 ${X_{1},X_{1},...,X_{k}}$ 组成投影矩阵,尺寸为 $n\times k$ 。将图像矩阵投影到第个特征向量上，可以得到第个主成分，尺寸为 $m\times 1$

$Y_{i}=AX_{i},i=1,2,..,k$

将k个主成分组成特征矩阵（特征图像） $Y=XW=[Y_{1},...,Y_{k}]$ ，尺寸为 $m\times k$ 。

使用特征提取得到的主成分和学习得到的特征向量计算重构子图像，亦或者使用特征矩阵和投影矩阵计算前k个重构子图像相加得到的重构图像。

重构子图像： $Y_{i}X_{i}^{T}$

重构图像： $\tilde{A}=YW^{T}= \sum_{i=1}^{k}Y_{i}X_{i}^{T}$

三、2DPCA编程（How）

使用VS2015+opencv 3.4.1进行编程，编程语言为C++，主要根据第二节的第三小节的步骤进行。我将ORL人脸数据库中每个人的10幅图像随机分为5幅训练图像和5幅测试图像，因此得到了训练数据集和测试数据集，大小都为200幅图像。使用训练数据集计算特征向量，载入训练数据集中一副图像进行特征提取和重构。

1、程序初始参数设置：

#include<iostream>
#include<opencv2\opencv.hpp>

using namespace std;
using namespace cv;

//void
//{

        //定义需要修改的变量
	int eigenNum = 2;   //特征向量数目
	int trainNum = 200; //训练样本数目
	int testNum = 200;  //测试样本数目
	int nrows = 112, ncols = 92; //样本大小
	string trainPath = "F:\\机器学习\\DataSet\\facetrain\\"; //训练样本存储路径
	string testPath = "F:\\机器学习\\DataSet\\facetest\\";  //测试样本存储路径

	//定义程序所需变量
	string samplePath;//当前样本
	Mat srcSample;    //当前样本
	Mat sampleAve = Mat::zeros(nrows, ncols, CV_32FC1);//样本均值
	Mat covMatrix = Mat::zeros(ncols, ncols, CV_32FC1);//协方差矩阵
	Mat eigenVecs(ncols, eigenNum, CV_32FC1); //特征向量
	Mat eigenVals(eigenNum, 1, CV_32FC1);     //特征值
	vector<Mat> trainSamples; //存储训练样本

2、载入所有二维图像矩阵 $\left \{ A_{1},A_{2},...,A_{N} \right \}$ ，图像大小为112*92，计算平均图像 $\overline{A}=\frac{1}{N}\sum_{i=1}^{N}A_{i}$ ；

       //加载图像，计算均值(图像ID号从1开始)
	for (int i = 1; i <= trainNum; i++)
	{
		samplePath = trainPath + to_string(static_cast<long long>(i)) + ".png";
		srcSample = imread(samplePath, 0);        //载入当前样本
		if (srcSample.empty())
		{
			cout << "图像不存在" << endl;
			return;
		}
		srcSample.convertTo(srcSample, CV_32FC1); //数据类型转换
		trainSamples.push_back(srcSample.clone());        //存储当前样本
		sampleAve += srcSample / double(trainNum);//计算样本均值
	}

3、对所有二维图像进行中心化处理，计算图像协方差矩阵 $G= \frac{1}{M}\sum_{i=1}^{N}(A_{i}-\overline{A})^{T}(A_{i}-\overline{A})$ ，矩阵大小为n*n；

        //计算协方差矩阵
	for (int i = 0; i < trainNum; i++)
	{
		srcSample = trainSamples[i] - sampleAve;//中心化处理
		covMatrix += srcSample.t()*srcSample/double(trainNum);//计算协方差矩阵
	}

4、计算图像协方差矩阵的特征向量和特征值，特征向量尺寸为n*1；选择前个最大特征值以及对于特征向量组成投影矩阵，投影矩阵尺寸为n*k。

        //计算特征向量和特征值
	Mat calcVecs, calcVals;
	eigen(covMatrix, calcVals, calcVecs);
	eigenVecs = (calcVecs.rowRange(0, eigenNum)).t();
	eigenVals = calcVals.rowRange(0, eigenNum);

	//保存特征向量
	CvMat storeMat;
	storeMat = eigenVecs;
	cvSave("eigenVecs.txt", &storeMat);

5、特征提取和重构图像，特征大小为m*k

	//特征提取图像重构
	samplePath = testPath + "2.png";
	srcSample = imread(samplePath,0);
	imshow("src", srcSample);
	srcSample.convertTo(srcSample, CV_32FC1);
	srcSample = srcSample - sampleAve;
	Mat feature = srcSample*eigenVecs;
	Mat reconImg = feature*eigenVecs.t() + sampleAve;
	normalize(reconImg, reconImg, 0, 255,CV_MINMAX, CV_8UC1);
	imshow("reconstruction", reconImg);
	samplePath = to_string(eigenNum) + ".png";
	imwrite(samplePath, reconImg);

程序结果输出：