主成分分析(降维)

本文详细介绍了主成分分析(PCA)的原理和步骤,用于高维数据降维,最大化低维空间中的方差。PCA通过计算协方差矩阵的特征值和特征向量实现,选择最大的n'个特征值对应的特征向量形成新坐标系。此外,还探讨了奇异值分解(SVD)的过程,并比较了PCA与SVD的区别。
摘要由CSDN通过智能技术生成

数据量太大时往往会有相关性较高的维度,给建模计算带来不必要的开支。


算法步骤:

输入:n维样本集D=(x^{(1)}, x^{(2)},...,x^{(m)}),要降维到的维数n'.

    输出:降维后的样本集D'

    1) 对所有的样本进行中心化: x^{(i)} = x^{(i)} - \frac{1}{m}\sum\limits_{j=1}^{m} x^{(j)}

    2) 计算样本的协方差矩阵XX^T

    3) 对矩阵XX^T进行特征值分解

    4)取出最大的n'个特征值对应的特征向量(w_1,w_2,...,w_{n'}), 将所有的特征向量标准化后,组成特征向量矩阵W。

    5)对样本集中的每一个样本x^{(i)},转化为新的样本z^{(i)}=W^Tx^{(i)}

    6) 得到输出样本集D' =(z^{(1)}, z^{(2)},...,z^{(m)})

推导:

PCA思想:

  •         将高维数据投影至低维空间,从而减少获得源数据的主要特征。
  •         获得低维转换的方法:在低维空间里方差最大。

有mXn维数据(x^{(1)}, x^{(2)},...,x^{(m)}),对其去中心化,\sum\limits_{i=1}^{m}x^{(i)}=0。设新坐标系正交基为

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值