LDA线性判别分析的原理推导与Python实现

最新推荐文章于 2022-10-31 16:55:33 发布

Allen__MB

最新推荐文章于 2022-10-31 16:55:33 发布

阅读量252

点赞数

分类专栏：机器学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43690603/article/details/100181258

版权

LDA（Linear Discriminant Analysis）是一种有监督的分类算法，他常常被用来做数据与处理中的降维或者分类任务

目的
LDA的目标是找出能够最大化类间区分度的坐标轴成分将特征空间（数据集中的多维样本）投影到一个维度更小的k维子空间中，同时保持区分类别的信息

原理
将原始数据投影到维度更低的空间中，使得投影后的点会形成按照类别区分，一簇一簇的情况，相同类别的店，将会在投影后的空间中更接近

与PCA区别
首先LDA是有监督的，此外，最大的区别是LDA计算的是另一类特定的方向，更关心分类而不是方差

目标函数的导出
LDA的目标是找出 $y=w^{T} x$ 中的 $w$ ，即投影方向

LDA分类器的一个目标是使得不同类别之间的距离越远越好，同一类别之中的距离越近越好，所以需要计算类内和类间的距离

每一类样本的均值为 $\mu_{i}=\frac{1}{N_{i}} \sum_{x \in \omega_{i}} x$
投影后，每一类样本均值变为 $\tilde{\mu}_{\mathrm{i}}=\frac{1}{N_{i}} \sum_{y \in \omega_{i}} y=\frac{1}{N_{i}} \sum_{x \in \omega_{i}} w^{T} x=w^{T} \mu_{i}$ 要使得投影后的两类样本中心点尽量分离，设定 $\mathrm{J}(\mathrm{w})=|\widetilde{\mu_{1}}-\widetilde{\mu_{2}}|=\left|w^{T}\left(\mu_{1}-\mu_{2}\right)\right|$ 但是只让 $\mathrm{J}(\mathrm{w})$ 最大只可以达到类间距离尽可能大，无法实现类内距离尽可能小，所以定义 $\tilde{s}_{i}^{2}=\sum_{y \in \omega_{i}}\left(y-\tilde{\mu}_{i}\right)^{2}$

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
LDA线性判别分析的原理推导与Python实现

feature_dict = {i: label for i, label in zip(range(4), ("sepal length in cm", "sepal width in cm", "petal length in cm", "petal width in cm"))}import pandas as pddf = pd.read_csv("i...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。