28.python机器学习-LDA和PCA

最新推荐文章于 2023-05-04 12:02:46 发布

大勇任卷舒

最新推荐文章于 2023-05-04 12:02:46 发布

阅读量436

点赞数 1

分类专栏： python机器学习文章标签： LDA PCA python 机器学习算法

@大勇若怯任卷舒

本文链接：https://blog.csdn.net/m0_47454596/article/details/114089480

版权

28.1 线性判别分析（LDA）

Linear Discriminant Analysis
- 用途：数据预处理中的降维，分类任务
- 历史：Ronald A. Fisher在1936年提出了线性判别方法
- 目标：LDA关心的是能够最大化类间区分度的坐标轴成分。将特征空间（数据集中的多维样本）投影到一个维度更小的 k 维子空间中，同时保持区分类别的信息
- 原理：投影到维度更低的空间中，使得投影后的点，会形成按类别区分，一簇一簇的情况，相同类别的点，将会在投影后的空间中更接近方法
  [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-LUn9i6yH-1614241178174)(https://upload-images.jianshu.io/upload_images/19745945-01fb78f3eaef8a00.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)]
- 监督性：LDA是“有监督”的，它计算的是另一类特定的方向
- 投影：找到更合适分类的空间
- 与PCA不同，更关心分类而不是方差
数学原理
Linear Discriminant Analysis
- LDA分类的一个目标是使得不同类别之间的距离越远越好，同一类别之中的距离越近越好
- 每类样例的均值：
- 投影后的均值：
- 投影后的两类样本中心点尽量分离：
- 只最大化J(w)就可以了？
- X1的方向可以最大化J(w)，但是却分的不好
- 散列值：样本点的密集程度，值越大，越分散，反之，越集中
- 同类之间应该越密集些：
- 目标函数：
- 散列值公式展开：
- 散列矩阵（scatter matrices）：
  [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-HeKDCzaQ-1614241178213)(https://upload-images

最低0.47元/天解锁文章

大勇任卷舒

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

大勇任卷舒 CSDN认证博客专家 CSDN认证企业博客

码龄4年

314: 原创

22万+: 周排名

158万+: 总排名

17万+: 访问

: 等级

3338: 积分

365: 粉丝

143: 获赞

46: 评论

265: 收藏

私信

关注

热门文章

分类专栏

最新评论

73.Zookeeper实现HiveServer2的HA
夜瑾: 大佬请教下，为什么我这边没有创建hive-site中指定的namespace，反而hive启动后会创建一个hs2ActivePassiveHA-sasl/instances/的znode，里面有instance-0000000000信息，并非是指定的namespace里面的10000端口信息
62.合理使用预训练网络-1
goyeer（工蚁）: 《62.合理使用预训练网络-1》才学兼优，出类拔萃。感情都是一点点淡的，人心也都是一点点凉的，不是所有的人都能一直等待;可我在乎你的关注，在乎你的三连！
97.HDFS文件系统挂载
夜里的一盏灯: 没有挂载成功怎么解决呀就是在/etc/fstab 加上了不管事
140.深度学习分布式计算框架-3
Jiangxl~: 文章内容丰富，条理清晰，值得一波关注，如沐春风，配图也很有趣，希望作者也指点我一番！
140.深度学习分布式计算框架-3
孤寒者: 这篇文章写得很好：写的非常详细，内容丰富，具有条理清晰，结构严谨，内容丰富和可借鉴性等特点。认真看完收获满满，期待下一篇文章的更新。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。