在线的PCA算法

在线PCA算法在大规模数据处理中显得尤为重要,尤其当数据流式到来时。离线PCA需要预先计算所有数据的协方差矩阵,而在线PCA则动态更新主成分。文章介绍了在线PCA的基本思想,通过求解特征问题更新主成分矩阵,并对比了在线PCA与离线PCA的运算量,指出在线PCA的效率优势。
摘要由CSDN通过智能技术生成

1、离线PCA

PCA是一种最基本的降维算法,在机器学习中被广泛使用。它是一种线性降维,其基本思想是:

对大量的数据,找到其主成分,主成分的个数小于原始数据的维度,然后将原始数据投影到主成分张成的空间中,

可减小数据的维度。

         从上面的描述我们可以总结出:

1.      原始数据(x1,x2,x3,…,xn)(列向量)是一个n维的数据,它是在n个基(1,0,0,…,0),(0,1,0,…,0),… ,(0,0,…0,1)下的表示。

2.      我们要找到k个主成分,每个主成分的维度是n,组成一个n×k的矩阵M,即每个主成分是M的一列。

3.      将原始数据投影到k个主成分张成的空间中,即可得到降维后的k维度的数据(x’1,x’2,x’3,…,x’k)(列向量),即(x’1,x’2,x’3,…,x’k)= (x1,x2,x3,…,xn) M。

         可以看到,PCA的主要工作是找到主成分。可是如何寻找呢?下

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值