降维与特征选择

最新推荐文章于 2023-06-15 16:24:59 发布

「已注销」

最新推荐文章于 2023-06-15 16:24:59 发布

阅读量833

点赞数 1

分类专栏：深度学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_46161549/article/details/119150148

版权

内容简介

主成分分析
主成分分析建模
偏最小二乘法
偏最小二乘法建模
Fisher LDA
特征选择方法

主成分分析（Principle Component Analysis, PCA）

主成分分析是一种线性、非监督、全局的降维算法
PCA的目的是找到数据中的主成分，并利用这些主成分表征原始数据从而达到降维的目的

具体讲就是：用少数的若干新变量（原变量的线性组合）替代原变量，新变量要尽可能多地反映原变量的数据信息，同时，新变量之间相互正交，可以消除原变量中相互重叠的信息

主成分分析过程推导

设样本的标准化输入变量矩阵为：

在这里插入图片描述
构造一个变量 $P_1$ ，且变量 $P_1$ 能携带标准化输入变量矩阵 $X_{n*k}$ 的信息，满足以下公式：

在信号处理领域，认为信号具有较大的方差，噪声具有较小的方差，信号与噪声之比称为信噪比。信噪比越大意味着数据质量越好，反之，信噪比越小；
如下图，黄线所处的轴数据分布更为分散，数据在这个方向上方差更大；显然，黄线就是主成分所在的轴
在这里插入图片描述

从概率统计观点可知，变量的方差越大，该变量包含的信息越多；因此，上述问题可以转化为要求变量 $P_1$ 的方差最大。 $P_1$ 的方差为
在这里插入图片描述
构造拉格朗日函数：

其中， $\lambda_1$ 为拉格朗日系数，分别计算 $L$ 对 $\lambda_1$ 和 $\bm t_1$ 的偏导数，并令其为零，则有：

由上式知， $\bm t_1$ 是 $V$ 的一个标准化特征向量， $\lambda_1$ 为其对应的特征值，故：
在这里插入图片描述
显然， $\bm t_1$ 是矩阵 $V$ 的最大特征值 $\lambda_1$ 所对应的标准化特征向量，对应的构造变量 $P_1=X\bm t_1$ 称为第一主成分，且第一主成分包含的特征信息最多；同理可以求出

最低0.47元/天解锁文章

「已注销」

关注

1
点赞
踩
9

收藏

觉得还不错? 一键收藏
2
评论
降维与特征选择

主成分分析（Principle Component Analysis, PCA）主成分分析是一种线性、非监督、全局的降维算法PCA的目的是找到数据中的主成分，并利用这些主成分表征原始数据从而达到降维的目的具体讲就是：用少数的若干新变量（原变量的线性组合）替代原变量，新变量要尽可能多地反映原变量的数据信息，同时，新变量之间相互正交，可以消除原变量中相互重叠的信息主成分分析过程推导设样本的标准化输入变量矩阵为：构造一个变量P1P_1P1，且变量P1P_1P1能携带标准化输入变量矩阵
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。