PCA降维算法

1、PCA降维的目的

(1)降低维度,减小计算复杂性

(2)减少冗余的特征

2、降维的原理

Z=X*U,X是m*n的矩阵,U是n*k的矩阵,Z是m*k的矩阵,就得到X降维后的降维矩阵Z。具体来说,将一组n维向量降为k维,其目标是选择k个单位正交基,使得原始数据变换到这组基上后,各字段(特征而非样本)两两间协方差为0,而字段的方差则尽可能大。

3、降维矩阵的求解

设原始数据X对应的协方差矩阵为C,Z=X*U为X对U做基变换后的数据。设Z的协方差矩阵为D,

因为U为基向量,所以,最终问题转换为:

引入拉格朗日,得到式子:

所以x投影后的方差即为协方差矩阵的特征值,最佳投影方向就是最大特征值对应的特征向量,次佳为第二大特征值对应的特征向量。

4、PCA算法流程

(1)计算训练集X的协方差矩阵C,

(2)求出C的特征值和特征向量

(3)特征值按照数值降序排列,特征向量按照特征值的顺序依次排列

(4)取前k个向量组成U

(5)Z=XU为降维后的矩阵

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值