PCA

最新推荐文章于 2024-06-22 18:43:34 发布

这还能被占用？

最新推荐文章于 2024-06-22 18:43:34 发布

阅读量233

点赞数

本文链接：https://blog.csdn.net/weixin_39516246/article/details/85226791

版权

模式识别导论专栏收录该内容

8 篇文章 0 订阅

订阅专栏

why

信息的冗余增加计算成本，可以通过对数据的分析来降低数据的维度。principal component analysis(PCA)就是一种非常有效的方式。

what is PCA

我们试图通过线性映射矩阵 $W$ 来对原始 $d$ 维的特征空间 $U=[u_1,u_2,\cdots,u_d]^T$ 进行降维，得到新的 $m$ 维特征空间 $[v_1,v_2,\cdots,v_m]^T$ ,即 $V=W^TU$

$v_i= \sum\limits_{j=1}^dw_{ij}u_j=W(:,i)^TU$
为了统一新特征的尺度，线性映射的约束条件为 $W(:,i)^TW*(:,i)=1$

我们的目标是使新特征的方差最大，即
$\hat{W}=\max\limits_{W}var(V)$
而
$var(V)=E(V^2)-(E(V))^2=E((W^TU)^2)-E(W^TU)E(U^TW)=W^TE(UU^T)W-W^TEUEU^TW=W^T(E(UU^T)-(EU)^2)W=W^T\Sigma W$
其中， $\Sigma$ 为原始特征 $U$ 的协方差矩阵

因此，最优化问题转换为
$\hat{W}=\max\limits_{W}var(V)=\max\limits_W W^T\Sigma W\qquad s.t. \quad W^TW=1$
用拉格朗日乘子法解上式，构造函数
$=W^T\Sigma W-\lambda(W^TW-1)$
则
$0=\frac{\partial L}{\partial W}=\Sigma W-\lambda W \\ 0=\frac{\partial L}{\partial \lambda}=W^TW-1$
由 $\lambda W=\Sigma W$ 可知：最优解 $\hat{W}$ 为原始特征的协方差矩阵所对应的特征向量。

由 $\max\limits_WW^T\Sigma W=\max\limits_WW^T\lambda W=\max\limits_W\lambda(W^TW)=\max\limits_W\lambda$ 可知目标函数的最值为协方差矩阵的最大特征向量。

因此，最优解 $\hat {W}$ 为原始特征向量协方差矩阵的最大特征值对应的特征向量。

how do PCA

step1:获取带标签的数据

step2:数据进行去均值处理

step3:计算原始特征的协方差矩阵

step4:计算协方差矩阵的特征值可特征向量

step5:选择最大的K个特征值对应的特征向量作为降维之后的K维特征空间

matlab实例

这里以yale人脸数据集为例，给出一段用PCA降维之后，再用KNN分类的列子，抛砖引玉

clc;clear;close all;
data = importdata('yale_face_data.mat');
train_fea = data.train_fea;
mean_train_fea = mean(train_fea')';
for i = 1:size(train_fea,2)
    mean_subtract_train_fea(:,i) = train_fea(:,i)-mean_train_fea;
end
Conv_train_fea =  mean_subtract_train_fea*mean_subtract_train_fea';
[V_train,D_train] = eig(Conv_train_fea);
%% PCA
for K=1:100
W = V_train(:,size(V_train,2)-K+1:1:size(V_train,2));
PCA_new_train_fea = W'*mean_subtract_train_fea;
%% 1_NN
test_fea = data.test_fea;
mean_test_fea = mean(test_fea')';%
for i = 1:size(test_fea,2)
    mean_subtract_test_fea(:,i) = test_fea(:,i)-mean_test_fea;
end
new_test_fea = W'*mean_subtract_test_fea;
for i=1:size(new_test_fea,2)
    for j=1:size(train_fea,2)
    temp_vec = new_test_fea(:,i)-PCA_new_train_fea(:,j);
    temp(j) = temp_vec'*temp_vec;
    end
    [m,n] = min(temp);
    t(i) = data.train_gnd(n);
end
t_out=[t;data.test_gnd];
flag = t_out(1,:)-t_out(2,:);
num_right_PCA(K) = sum(flag==0);
end
plot(1:K,num_right_PCA,'o');
axis([0 K 0 45]);
title('PCA+1-NN')
xlabel('num\_k')
ylabel('num\_right')

这还能被占用？

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
PCA

why信息的冗余增加计算成本，可以通过对数据的分析来降低数据的维度。principal component analysis(PCA)就是一种非常有效的方式。what is PCA我们试图通过线性映射矩阵 WWW 来对原始 ddd 维的特征空间 U=[u1,u2,⋯&amp;amp;ThinSpace;,ud]TU=[u_1,u_2,\cdots,u_d]^TU=[u1,u2,⋯,ud]T 进...
复制链接

扫一扫

专栏目录