数据降维之主成分分析（PCA）与线性判别分析（LDA）对比

最新推荐文章于 2023-08-29 18:21:11 发布

章鱼千

最新推荐文章于 2023-08-29 18:21:11 发布

阅读量1.5k

点赞数

分类专栏：机器学习数据可视化文章标签：数据降维主成分分析（PCA）线性判别分析（LDA）

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ZhangYuq16/article/details/101730318

版权

机器学习同时被 2 个专栏收录

4 篇文章 0 订阅

订阅专栏

数据可视化

2 篇文章 1 订阅

订阅专栏

算法异同

相同点：

两者都是线性降维算法；
两者均利用了矩阵特征值分解的思想；

不同点：

LDA为有监督的方法，要求原始数据包含类别标签PCA为无监督的方法；
LDA降维有维数限制，必须降至数据类型数减一维及以下，PCA没有维数限制；
LDA降维时以类间距离最大、类内距离最小为目标，PCA以所有样本间距离最大为目标；
LDA本身可以用于分类，PCA不行；
PCA方法下特征向量可以表示对应特征保留的“信息量”，LDA不行；

算例分析

分别利用PCA与LDA对39节点电网仿真数据进行降维，原始数据共160个特征，包括各个节点的电压、功率等信息。
原始数据共包含三类，分别为电网稳定、不稳定与潮流不收敛。

由于原始数据只包含三类数据，因此如果选择用LDA降维则必须降至二维或一维，这必然会导致大量的信息丢失；PCA则没有维数限制，可以根据需求自由选择维数，可能保留更多信息。

在进行数据可视化时，通常需要将数据降至二维方便观察，分别利用LDA与PCA讲数据降至二维可得：
PCA降至二维
LDA降至二维
可见PCA在降维时并未考虑标签信息，因此三类数据点混杂在一起；LDA则可以使三类数据点尽可能分离。
因此如果希望利用数据降维算法进行高维数据可视化，则应选择LDA算法。

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
数据降维之主成分分析（PCA）与线性判别分析（LDA）对比

算法异同相同点：两者都是线性降维算法；两者均利用了矩阵特征值分解的思想；不同点：LDA为有监督的方法，要求原始数据包含类别标签PCA为无监督的方法；LDA降维有维数限制，必须降至数据类型数减一维及以下，PCA没有维数限制；LDA降维时以类间距离最大、类内距离最小为目标，PCA以所有样本间距离最大为目标；LDA本身可以用于分类，PCA不行；PCA方法下特征向量可以表示对应特征...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。