两种降维方法原理：PCA和LDA

最新推荐文章于 2022-11-08 20:16:19 发布

SnowQueen1024

最新推荐文章于 2022-11-08 20:16:19 发布

阅读量867

点赞数

分类专栏：算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/SnowQueen1024/article/details/103522771

版权

算法专栏收录该内容

1 篇文章 0 订阅

订阅专栏

1、PCA(主成分分析)

一句话：PCA将方差最大的方向作为主成分，使用主成分来表示原始数据可以去除冗余的维度，达到降维的目的。

无监督降维技术，利用正交变换把由线性相关变量表示的观测数据转换为少数几个由线性无关变量表示的数据，线性无关的变量称为主成分。PCA选择的是投影后数据方差最大的方向。因此PCA假设方差越大，代表的信息量越大。

总结：
PCA虽然可以很好地解除线性相关性，但是对于高阶相关性，需要借助Kernel PCA，通过Kernel函数将非线性相关转为线性相关。

另外，PCA假设数据各主特征是分布在正交方向上，如果在非正交方向上存在几个方差较大的方向，PCA的效果就大打折扣了。

PCA的基本数学原理可参考：
http://blog.codinglabs.org/articles/pca-tutorial.html

2、LDA(线性判别分）
有监督的，选择的是投影后类内方差小、类间方差大的方向。用到了类别标签信息，为了找到数据中具有判别性的维度，使原始数据在这些方向上投影后，不同类别尽可能区分开来。

总结：
LDA算法既可以用来降维，又可以用来分类，但主要是降维。
优点：
1、有监督，故可以使用先验知识经验。
2、依赖样本均值而不是方差，算法较优。
缺点：
1、LDA不适合对非高斯分布样本进行降维，PCA同样
2、过拟合现象
3、使用均值，效果不好。

例如：
语音设别中，如果想从音频中提取某人的语音信号，可以使用PCA进行降维，来过滤掉一些固定频率（方差相对较小）的背景噪声。但如果需要从这段音频中识别出声音属于哪个人的，就需要使用LDA对数据进行降维，使每个人的语音信号具有区分性。

参考原文链接：https://blog.csdn.net/lyq_12/article/details/86603074

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
两种降维方法原理：PCA和LDA

1、PCA(主成分分析)无监督降维技术，利用正交变换把由线性相关变量表示的观测数据转换为少数几个由线性无关变量表示的数据，线性无关的变量称为主成分。LDA选择的是投影后数据方差最大的方向。因此PCA假设方差越大，代表的信息量越大，使用主成分来表示原始数据可以去除冗余的维度，达到降维的目的。[----暂未了解----]2、LDA(线性判别分）有监督的，选择的是投影后类内方差小、类间方差大的...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。