机器学习：特征提取之LDA

最新推荐文章于 2024-07-15 22:36:19 发布

Be-real

最新推荐文章于 2024-07-15 22:36:19 发布

阅读量5.1k

点赞数 3

分类专栏：机器学习文章标签：机器学习 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/pantingd/article/details/106959374

版权

1. LDA的基本思想

LDA基本思想：给定带有标签的训练样本集，设法将样本投影到一条直线上，使得同类样本的投影点尽可能近，异类样本的投影点尽可能远。如果是进行分类，将新样本投影到同样的这条直线上，根据投影点的位置来确定新样本的类别。
将高维的模式样本投影到最佳鉴别矢量空间，以达到抽取分类信息和压缩特征空间维数的效果，投影后保证模式样本在新的子空间有最大的类间距离和最小的类内距离，即模式在该空间中有最佳的可分离性
参考其它作者图
举个例子，上图给出了两种不同的投影方式，直观上来看右图更好。因为右图中蓝色和红色数据较为集中，且类别之间的距离明显，而左图边界处数据混杂。
那么如何用数学语言对“同类样本的投影点尽可能近（组内差异），异类样本的投影点尽可能远（组间差异）”进行表达呢？

2. 二分类LDA原理

接下来从二分类LDA入手，分析LDA原理

在这里插入图片描述
图中红色实心的圆点表示类别为0的样本的均值在直线上的投影位置，红色实心三角形表示的是类别为1的样本的均值在直线上的投影位置

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。