PCA 学习笔记

文章目录

前言

重要的算法还是写写笔记吧

PCA

主成分分析(PCA)是一种降维方法,使用一个超平面,对正交属性空间中的所有样本点进行恰当的表达。超平面应该满足这样的性质:

  1. 最近重构性:样本点到这个超平面的距离都足够近
  2. 最大可分性:样本点在这个超平面上的投影尽可能分开
    基于这两个可以分别得到等价推导。
    在这里插入图片描述
    然后可得投影后的样本为 W ⊤ X W^{\top}X WX,这里是中心化后的样本。
    样本 X X X 大小为 d × m d\times m d×m。降维后的维数 d ′ d' d 由用户事先指定,可以通过交叉验证,或者指定重构阈值 t t t,找到满足重构阈值的最小维数:
    在这里插入图片描述
    其中 λ i \lambda_i λi 为协方差矩阵的特征值。
    由于舍弃了最小的 d − d ′ d-d' dd 个特征值对应的特征向量,因此必然会有信息的丢失,但这往往是必要的:
  1. 增大采样密度
  2. 最小的特征值对应的特征向量往往与噪声有关,舍弃他们往往能在一定程度上起到去噪的效果。

特征分解就是解行列式方程,比如求解矩阵 A = [ − 1 1 0 − 4 3 0 1 0 2 ] A = \begin{bmatrix} -1 & 1 & 0 \\ -4 & 3 & 0 \\ 1 & 0 & 2\end{bmatrix} A=141130002 的特征值与特征向量。
∣ A − λ I ∣ = ∣ λ I − A ∣ = ∣ λ + 1 1 0 − 4 λ − 3 0 1 0 λ − 2 ∣ = ( λ + 1 ) ∗ ( λ − 3 ) ∗ ( λ − 2 ) + 1 ∗ 0 ∗ 1 + 0 ∗ ( − 4 ) ∗ 0 − 0 ∗ ( λ − 3 ) ∗ 1 − 1 ∗ ( − 4 ) ∗ ( λ − 2 ) − ( − 1 ) ∗ 0 ∗ 0 = ( λ + 1 ) ∗ ( λ − 3 ) ∗ ( λ − 2 ) + 4 ( λ − 2 ) = ( λ − 2 ) ( λ 2 − 2 λ − 3 + 4 ) = ( λ − 2 ) ( λ − 1 ) 2 | A-\lambda I|=|\lambda I - A| = \left |\begin{matrix} \lambda+1 & 1 & 0 \\ -4 & \lambda-3 & 0 \\ 1 & 0 & \lambda-2\end{matrix}\right|=(\lambda+1)*(\lambda-3)*(\lambda-2)+1*0*1+0*(-4)*0-\\ 0*(\lambda-3)*1-1*(-4)*(\lambda-2)-(-1)*0*0\\=(\lambda+1)*(\lambda-3)*(\lambda-2)+4(\lambda-2)\\ =(\lambda -2)(\lambda^2-2\lambda-3+4)\\ =(\lambda -2)(\lambda -1)^2 AλI=λIA=λ+1411λ3000λ2=(λ+1)(λ3)(λ2)+101+0(4)00(λ3)11(4)(λ2)(1)00=(λ+1)(λ3)(λ2)+4(λ2)=(λ2)(λ22λ3+4)=(λ2)(λ1)2
所以 λ = 1 , 2 \lambda = 1,2 λ=1,2.
这里 A A A λ I \lambda I λI 交换后特征值不变,但是对应的特征向量会变,我参考百度百科,我的顺序应该是对的,但是不确定交换顺序后是否等价。百度百科截图如下:
在这里插入图片描述
对于特征值 1,其对应的特征向量 x = [ x 1 , x 2 , x 3 ] ⊤ x=[x_1,x_2,x_3]^{\top} x=[x1,x2,x3]
∣ − 1 − 1 1 0 − 4 3 − 1 0 1 0 2 − 1 ∣ x = 0 \left |\begin{matrix} -1-1 & 1 & 0 \\ -4 & 3-1 & 0 \\ 1 & 0 & 2-1\end{matrix}\right|x=0 114113100021x=0
∣ − 2 1 0 − 4 2 0 1 0 1 ∣ x = 0 \left |\begin{matrix} -2 & 1 & 0 \\ -4 & 2 & 0 \\ 1 & 0 & 1\end{matrix}\right|x=0 241120001x=0
所以标准化后的特征向量 x = [ − 1 6 , − 2 6 , 1 6 ] ⊤ x=[\frac{-1}{\sqrt{6}},\frac{-2}{\sqrt{6}},\frac{1}{\sqrt{6}}]^{\top} x=[6 1,6 2,6 1]

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值