[机器学习] LDA理论

最新推荐文章于 2023-08-29 21:24:11 发布

kuang_liu

最新推荐文章于 2023-08-29 21:24:11 发布

阅读量1.6k

点赞数

分类专栏：机器学习人脸识别文章标签：机器学习 LDA

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/kuang_liu/article/details/13005739

版权

机器学习同时被 2 个专栏收录

3 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

1. LDA 与 PCA

线性判别分析（Linear Discriminant Analysis, LDA）和主成分析法（PCA）都可以用于数据分类和降低维度。
但 LDA 在降维的同时尽可能的保留不同类数据的差别。
LDA 使不同类的数据它们的差别尽可能的大，而使同一类的数据它们的差别尽可能的小。即让类型间的差别与同一类型内的差别的比值尽可能的大。
LDA 比 PCA 更好的体现出数据的分布（即类型间的差别）。

一张图体现 PCA 与 LDA 的区别：

PCA能体现数据的特征（比如整体的走势 or 斜率），但两类数据投影后混在一起。LDA方法（or Fisher Linear Discriminant, FLD）也能把数据从二维降到一维，并且投影后两类数据分开，更能够体现数据间的区别。

2. LDA计算步骤

1. 获取数据

有 n 组数据，每组数据 m 维，分为 c 类，n、m、c 已知。

设第 i 类内有 ni 个数据，显然：

$\sum_{i=1}^{c}n_i=n$

数据按行排列，每一类组织成一个矩阵。第 i 类数据表示为：

$X_i=\begin{bmatrix}r_1\\ r_2\\ . \\. \\r_{ni}\end{bmatrix}\ (i=1\ ...\ c)$

整个数据集合 X 表示为：

$X=\begin{bmatrix}X_1\\ X_2\\ . \\. \\X_c\end{bmatrix}$

整个数据集合 X 是 n * m 维的，我们寻求一个变换矩阵 W 使变换后的矩阵是 (c-1) * m维，即把每组数据从 n 维降到 c-1 维。

即： $Y = W^T\cdot{X}$ ，W 是 m * (c - 1) 维。

2. 计算各类的平均值和协方差

对于每一个类 Xi 计算它的平均值和方差：

平均值：

$\mu_i=\sum_{x\in X_i}x$

协方差：

$Si=\sum_{x\in X_i}{(x-\mu_i)^T(x-\mu_i)}$ （m * m 维）

整个数据集合 X 的平均值：

$\mu=\sum_{i=1}^c\mu_i$

3. 计算类内和类间的分散度

类内分散度（Between-class scatter）：

$S_b=\sum_{i=1}^c{n_i(\mu_i-\mu)^T(\mu_i-\mu)}$

类间分散度（Within-class scatter）：

$S_w=\sum_{i=1}^c{S_i}$

我们的目标是使投影后的数据类间风散度和类内风散度的比值尽可能的大。

求解过程用到了导数，详细计算过程可以看后面列出的参考文档。

4. 计算特征值和特征向量

计算矩阵： $S_w^{-1}\cdot{S_b}$ 阵的特征值和特征向量。

传统意义上只有对称矩阵才有特征值和特征向量，如果对于一个一般的矩阵 A 也满足：

$Ax=\lambda{x}$

传则λ 和 x 称为矩阵 A 的广义特征值(general eigenvalue)和广义特征向量(general eigenvector)。

特征值记为：Λ = [ λ1, λ2, ... ,λc-1 ]

特征向量记为：

$V=\begin{bmatrix}v_1\\ v_2\\ \vdots \\v_{c-1}\end{bmatrix}$

特征向量 V 是 c-1 * m 维，就是我们需要的变换矩阵 W.

Reference:

A Tutorial on Data Reduction：Linear Discriminant Analysis (LDA) [Aly A. Farag, Shireen Y. Elhabian, CVIP Lab University of Louisville]
L10: Linear discriminants analysis

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
[机器学习] LDA理论

1. LDA 与 PCA线性判别分析（Linear Discriminant Analysis, LDA）和主成分析法（PCA）都可以用于数据分类和降低维度。但 LDA 尽可能的保留不同类数据的差别。LDA 使不同类的数据它们的差别尽可能的大，而使同一类的数据它们的差别尽可能的小。即让类型间的差别与同一类型内的差别的比值尽可能的大。LDA 比 PCA 更好的体现出数据的分布
复制链接

扫一扫

专栏目录

kuang_liu CSDN认证博客专家 CSDN认证企业博客

码龄12年

7: 原创

117万+: 周排名

79万+: 总排名

7万+: 访问

: 等级

479: 积分

25: 粉丝

57: 获赞

16: 评论

160: 收藏

私信

关注

热门文章

分类专栏

机器学习 3篇
人脸识别 1篇

最新评论

信息与熵的计算
睿虎: l(x1) = -log2(0) = -Infinity => l(x1) = -log2(0) = Infinity
[线性代数] 如何求协方差矩阵
双仔宝贝: 也就是属性
[线性代数] 如何求协方差矩阵
双仔宝贝: 你可以看下这个 https://blog.csdn.net/dugudaibo/article/details/78931825
[线性代数] 如何求协方差矩阵
龙剑寻仙: 博主，我想问一下这个按列排列的协方差分母为什么是m 而不是m-1
[线性代数] 如何求协方差矩阵
想写一个bot发财: 想问一下每一列是一个随机变量是什么意思

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。