数据压缩之降维（一）——PCA降维

最新推荐文章于 2023-07-12 08:12:20 发布

Amy_mm

最新推荐文章于 2023-07-12 08:12:20 发布

阅读量2k

点赞数

分类专栏： python sklearn 机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Amy_mm/article/details/79812241

版权

学习《python machine learning》chapter5——Compressing data via dimensionality reduction

主要内容如下：

（1）主要成分分析 Principal Component Analysis (PCA) ——非监督学习

（2）线性判别分析 Linear Discriminant Analysis (LDA) ——监督学习

（3）核主成分分析 Kernel Principal Component Analysis ——非线性降维

源码 git 地址：https://github.com/xuman-Amy/compressing-data

【PCA】

主要思想：在高维数据集中找到变化最大的方向，并把它投射到一个同等维度或者更低维度的子空间上。

主要方法：创建一个维的转换矩阵,通过转换矩阵将样本向量 x 从原本的d 维特征子空间转换到 k 维特征子空间。

（）。

通过转换矩阵后，新特征是旧特征的线性组合，新特征线性无关，最终的新特征子集相互正交。

主要步骤：

（1）标准化d维数据集（Standardize）

（2）创建协方差矩阵（covariance matrix）

（3）将协方差矩阵分解为特征向量和特征值（eigenvectors and eigenvalues）

（4）通过降序排列特征值从而实现对相应的特征向量进行排序。

（5）选择K个特征向量，这K个特征向量对应K个最大的特征值。（K即特征新子集的维度）

（6）选择top K个特征向量创建投影矩阵W

（7）通过投影矩阵W对d维输入数据集进行转换，得到k维特征子空间。

【通过python逐步进行PCA】

【准备

最低0.47元/天解锁文章

关注

0
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
数据压缩之降维（一）——PCA降维

学习《python machine learning》chapter5——Compressing data via dimensionality reduction主要内容如下：（1）主要成分分析 Principal Component Analysis (PCA) ——非监督学习（2）线性判别分析 Linear Discriminant Analysis (LDA) ——监督学习...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。