线性判别分析LDA

最新推荐文章于 2022-03-24 21:55:15 发布

「已注销」

最新推荐文章于 2022-03-24 21:55:15 发布

阅读量1.1k

点赞数

分类专栏：机器学习文章标签： lda算法原理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xtingjie/article/details/72770469

版权

机器学习专栏收录该内容

16 篇文章 3 订阅

订阅专栏

线性判别分析是一种降维方法

也是一种特征提取方法

这里写图片描述

线性判别分析是一个线性变换，也就是将原始数据乘以一个变换矩阵 $W$

$Y=W^TX$

其中 $X$ 就是原始数据， $Y$ 是变换后的数据，也就是降维后的矩阵

由上面的示意图就可以看出，实际上LDA就是致力于把数据投影到一个低维空间里面去，在这个低维空间里面，数据具有最大的可分性

公式的推导

设高维特征集 $X={x_1,x_2,...,x_n}$ ，其中有 $n_1$ 个样本属于第一类 $\omega_1$ ， $n_2$ 个样本属于 $\omega_2$ ，以此类推，设一共有 $C$ 类，有 $n_C$ 个样本属于 $\omega_C$ ，则存在一个变换矩阵 $W$ 使得

$Y=W^TX$

假设 $m_1,m_2,...,m_C$ 分别为变换前的每一类样本的均值向量

$m$ 是变换前所有样本的均值向量

假设 $\mu_1,\mu_2,...,\mu_C$ 分别为变换后的每一类样本的均值向量

则有：

$\mu_1=W^Tm_1,\mu_2=W^Tm_2,...,\mu_C=W^Tm_C$

总体均值也存在这样的关系：

$\mu=W^Tm$

设类间散度描述如下：

$J1= \sum \limits_{c=1}^C n_c\Vert\,\mu_c-\mu\Vert^2\\ \ \ \ \ \ =\sum\limits_{c=1}^Cn_c\Vert W^Tm_c-W^Tm\Vert^2\\ \ \ \ \ \ =Tr(W^TS_BW)$

其中 $S_B=\sum\limits_{c=1}^Cn_c(m_c-m)(m_c-m)^T$ ，这是变换前的数据的类间离散度矩阵

设类内离散度矩阵如下：

$J2=J2_1+J2_2+...+J2_C\\ \ \ \ \ =\sum\limits_{x\in\omega_1}\Vert W^Tx-W^Tm_1\Vert^2+...+\sum\limits_{x\in\omega_C}\Vert W^Tx-W^Tm_C\Vert^2\\ \ \ \ \ =Tr(W^TS_WW)$

其中 $S_W=\sum\limits_{c=1}^C\sum\limits_{x\in\omega_c}(x-m_c)(x-m_c)^T$ ，这个矩阵表示类内离散度矩阵

那么LDA实际上致力于使得变换后的数据具有最大可分性，因此它的模型如下：

$\max\limits_W\dfrac{J1}{J2}=\max\limits_W\dfrac{Tr(W^TS_BW)}{Tr(W^TS_WW)}$

可以转换为求解下面的特征方程：

$S_BW=\lambda S_WW$

把 $S_W$ 移到左边就可以发现，其实是求 $S_W^{-1}S_B$ 的特征值和特征向量

将求出来的特征向量按序逐列排列，就得到 $W$ 了， $W$ 有 $C-1$ 列

为什么LDA降维只能降到C-1维?

为什么求出来的 $W$ 是 $C-1$ 列的？

因为 $S_W^{-1}S_B$ 只有 $C-1$ 个特征值。

观察 $S_B$ 的表达式可以发现，它由 $C$ 个矩阵相加而成

因此它的秩小于等于这 $C$ 个矩阵的秩之和

观察这 $C$ 个矩阵可以发现，他们都是由一个列向量乘以这个列向量的转置而得到的

这样的矩阵的秩小等于1

因此 $S_B$ 的秩小等于 $C$

而实际上， $\mu_k-\mu$ 可以由其他 $C-1$ 个 $\mu_i$ 线性表示
因此因此 $S_B$ 的秩为 $C-1$

同理可得 $S_W$ 的秩为 $C$

因此 $S_W^{-1}$ 的秩也为 $C$

因此 $S_W^{-1}S_B$ 的秩为 $C-1$ （因为两矩阵相乘的秩小于秩较小的那个矩阵的秩）

而秩就代表了非零特征值的个数

「已注销」

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

「已注销」 CSDN认证博客专家 CSDN认证企业博客

码龄7年

76: 原创

-: 周排名

-: 总排名

96万+: 访问

: 等级

4483: 积分

103: 粉丝

414: 获赞

48: 评论

1298: 收藏

私信

关注

热门文章

分类专栏

HTML JavaScript CSS 16篇
笔记 1篇
算法 1篇
PPT 2篇
MATLAB 12篇
markdown编辑器 3篇
遗传算法 3篇
office 6篇
神经网络 3篇
支持向量机 2篇
强化学习 2篇
Python 23篇
numpy 5篇
scipy 1篇
matplotlib 3篇
机器学习 16篇
sklearn 2篇
python爬虫 3篇

最新评论

python爬虫：抓取页面上的超链接
m0_73724599: 为什么会爬出非超链接的东西
scipy常数
Chasing Aurora: 放屁，e是自然常数，那是电子好吗？
HTML+JavaScript实现在浏览器里自由画线1.0
m0_71020588: 你好老师，这个代码，我运行后，成功了，前面是忘了保存，刚才重新看了一下，保存后运行，能在html浏览器上，进行鼠标涂鸦了，现在是几个问题，1，这个是白底的颜色，能否把颜色改为透明色，2，这个涂鸦区域是固定的，能否自定义为能在整个屏幕上批注，3，能否把这个web上批注的功能，作成是一个叠加图层，叠加在电脑幕屏（或web浏览器的）任意一个界面上，不管是游戏还是视频还是网页还是wps，都可以叠加在这些界面上，4，还是应该开发几个批注的工具菜单，线条可以换颜色，线条可以调粗细，5，可以定一个白板批注状态，透明批注状态，黑板批注状态，青绿色批注状态（就象学校教室的黑板是青绿色），6，有一个键是能清空批注，有撤销，有像皮擦，……还能一键截图保存当前的屏幕批注画面到指定的文件夹，还可以一键录屏，把批注过程录制成一个视频，保存到指定文件夹，以上，盼老师能继续开发，谢了！
HTML+JavaScript实现在浏览器里自由画线1.0
m0_71020588: 我看了一下您的代码，是要用鼠标来作这个按下左键进入这个操作界面，您可以看一下epic pen，这个软件可以配手写板，用手写笔在wacom手写板上进行屏幕批注，很方便的
HTML+JavaScript实现在浏览器里自由画线1.0
m0_71020588: 您好老师，我把您这个代码导入到vscode，运行，没有成功，我是想弄一个屏幕批注，类似于win系统的那个epic pen软件，可以叠加在任何一个屏幕或软件的界面上，不管这个软件界面是视频的还是网页的还是word还是游戏，它都在叠加在这些界面上，任意写字，不知能否加您微信，好好交流一下，能否复刻一个epic pen那样的软件，谢谢了

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。