机器学习：线性(Fisher)判别分析

最新推荐文章于 2023-10-08 18:50:12 发布

GentleCP

最新推荐文章于 2023-10-08 18:50:12 发布

阅读量2.2k

点赞数 1

分类专栏：机器学习(深度学习) 文章标签：机器学习线性判别分析 LDA Fisher 散度矩阵

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/GentleCP/article/details/103791208

版权

本文详细介绍了线性(Fisher)判别分析（LDA），包括其基本思想、散度矩阵、目标函数与权重向量的推导。LDA旨在最大化类间距离与类内距离的比值，通过寻找最佳投影方向使同类样本聚集，异类样本分离。文章还给出了决策函数的构建过程，为机器学习中的分类任务提供了理论基础。

摘要由CSDN通过智能技术生成

文章目录

前言
一、散度矩阵
二、目标函数与权重向量
三、总结
参考资料

本文属于我的机器学习/深度学习系列文章，点此查看系列文章目录

前言

线性(Fisher)判别分析(Linear Discriminant Analysis, LDA)也属于线性分类方法的一种，由(Fisher,1936)提出，所以也叫Fisher判别分析。

LDA的基本思想是：对于给定的训练数据样本，将样本投影到一条直线上，让同类的样例的投影点尽可能近，异类样例投影点尽可能远，这样就区分开了两类样本。当对新的样本预测时，将其投影到这条直线上，看其离哪个分类近来确定它的类别。

将上面的思想转化成对目标函数的优化，就得到了：
$\max_{\mathbf w}J(\mathbf w) = \frac{类间平均距离}{类内平均距离}$

下图是LDA的二维示意图：
在这里插入图片描述

一、散度矩阵

首先设给定数据集 $D=\{(\mathbf x_i,y_i)_{i=1}^m, y_i\in \{0,1\}\}$ ，我们需要用给定数据去刻画类间和类内距离。

类间距离
两类样本的类间距离怎么刻画？这么多点，只能通过找两个代表性的点来计算距离，显然是均值向量点。将两个均值向量( $\mu_1,\mu_2$ )投影到直线上，得到投影点（ $m_1,m_2$ ）之间的距离平方 $m_1-m_2)^2$ 。向量 $\mu$ 在另一向量 $\mathbf w$ 上的投影为 $\mathbf w^T \mu$ (忘了的可以看机器学习：线性分类问题（基础知识）)。

由此我们有
$(m_1-m_2)^2 \\ = [\mathbf w^T(\overrightarrow \mu_1-\overrightarrow \mu_2)] ^2\\ = [\mathbf w^T(\overrightarrow \mu_1-\overrightarrow \mu_2)][\mathbf w^T(\overrightarrow \mu_1-\overrightarrow \mu_2)]^T\\ = \mathbf w^T(\overrightarrow \mu_1-\overrightarrow \mu_2)(\overrightarrow \mu_1-\overrightarrow \mu_2)^T\mathbf w\\ = \mathbf w^T S_b \mathbf w\\ S_b = (\overrightarrow \mu_1-\overrightarrow \mu_2)(\overrightarrow \mu_1-\overrightarrow \mu_2)^T,类间散度矩阵$

最低0.47元/天解锁文章

关注

1
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。