机器学习-LDA(线性判别)降维算法

最新推荐文章于 2024-07-12 15:12:07 发布

yanta0

最新推荐文章于 2024-07-12 15:12:07 发布

阅读量1.7k

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yanta0/article/details/84866466

版权

LDA是一种有监督的降维算法，旨在使同一类数据在低维空间中聚集，不同类数据分散。它假设数据按均值分类且不同类有相同协方差矩阵。LDA通过最大化类间散度和最小化类内散度找到投影方向。当数据主要由均值区分时，LDA效果优于PCA；反之，PCA表现更佳。算法流程包括计算类内、类间散度矩阵，求解特征值和特征向量，最终进行数据投影。

摘要由CSDN通过智能技术生成

LDA(线性判别算法)

不同于PCA方差最大化理论，LDA算法的思想是将数据投影到低维空间之后，使得同一类数据尽可能的紧凑，不同类的数据尽可能分散。因此，LDA算法是一种有监督的机器学习算法。同时，LDA有如下两个假设:

(1) 原始数据根据样本均值进行分类。

(2) 不同类的数据拥有相同的协方差矩阵。

当然，在实际情况中，不可能满足以上两个假设。但是当数据主要是由均值来区分的时候，LDA一般都可以取得很好的效果。

图1 LDA和PCA对数据进行降维

如图1所示，原始数据主要是根据均值来划分的，此时LDA降维效果很好，但是PCA效果就很差。

图2 LDA和PCA对数据进行降维

图2的两类数据主要区别是方差不同，因此此时PCA降维效果比较好，而LDA降维效果比较差。

1 基本思想

将原始数据投影至低维空间，尽量使同一类的数据聚集，不同类的数据尽可能分散。

1 原理推导

假设我们现已有如下的数据集 $D={(x_{1},y_{1}),(x_{2},y_{2}),...,(x_{m},y_{m}),}$ 其中样本

$x_{i}$ 为任意维向量，类别 $y_{i}\in{C_{1},C_{2},...,C_{k}}$ ，定义 $N_{j\in{1,2,...,k}}$ 是第类样本的个数， $X_{j(j\in{1,2,...,k})}$ 是第类样本的集合， $\mu_{j(j\in{1,2,...,k})}$ 是第类样

最低0.47元/天解锁文章

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。