数据降维——主成分分析PCA

最新推荐文章于 2024-04-07 21:40:05 发布

qq_16608563

最新推荐文章于 2024-04-07 21:40:05 发布

阅读量768

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/qq_16608563/article/details/89024442

版权

本文介绍了主成分分析PCA和线性判别分析LDA的基本概念，PCA旨在最大化数据在主轴上的投影方差，通过特征值分解或SVD实现，用于无监督降维；LDA则是有监督降维，目标是最大化类间距离并最小化类内距离，用于分类。PCA与LDA的主要区别在于是否利用标签信息以及优化目标的不同。

摘要由CSDN通过智能技术生成

一：预备知识
向量

向量的内积与投影：
在这里插入图片描述
两个向量A, B 内积的计算公式为： $A ▪ B = ∣ A ∣ ∣ B ∣ c o s (α)$
1）向量内积的几何解释就是：向量A在向量B上的投影长度（ $∣ A ∣ c o s (α)$ ）乘以向量B的模
特别的，如果一个向量如a是某个坐标轴的单位向量，那么两个向量的内积 $a ▪ b$ 就是向量在此坐标轴上的坐标值。
2）从内积的数值上我们可以看出两个向量在方向上的接近程度。当内积为正值时，两个向量大致指向相同的方向（方向夹角小于90度）；当内积为负值时，两个向量大致指向相反的方向；当内积值为0时，两个向量互相垂直。
（这个后面用于协方差和相关性的说明）

基与基变换：
1、定义：设 $F^{n}的非空子集V是F上的向量空间，如果V中的(有序)向量组\alpha _{1},\alpha _{2},\cdots,\alpha _{m}线性表示满足$
（1） $\alpha _{1},\alpha _{2},\cdots,\alpha _{m}线性无关；$
（2） $V中的向量都可由\alpha _{1},\alpha _{2},\cdots,\alpha _{m}线性表示,$