降维之 MDS算法的直觉

最新推荐文章于 2021-01-11 10:15:34 发布

就叫温华啦

最新推荐文章于 2021-01-11 10:15:34 发布

阅读量1.9k

点赞数

分类专栏：机器学习算法的直觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/a3765421/article/details/84649040

版权

机器学习算法的直觉专栏收录该内容

13 篇文章 0 订阅

订阅专栏

为什么需要降维呢？

因为啊，在高维空间中，如果要满足密采样，那么需要的样本数就太多了，惹不起惹不起，

（比如，1维时填充单位空间需要三个样本， 2维时填充单位空间需要九个样本，3维时需要27个。。。。。。那么 100维就需要3^100个样本，这就太可怕了。）另外，高维空间中的距离是特别奇怪的。

为什么能降维呢？

这是因为在很多时候，人们观察或收集到的很多样本虽是高维的，但是与学习任务相关的也许仅是某个低维分布。

什么意思呢，比如你手机到的数据集中每个样本有100属性，但是只需要使用其中10个属性来训练模型就能有很好的性能。

MDS算法的思想：

MDS算法的核心思想是：降维前后，各自样本间的距离是不变的。

由此列出式子：原空间中的两样本xi，xj之间的距离dist（ i，j）等于降维后这两样本zi，zj之间的距离 || zi - zj||.

|

|

由此经过一系列的变换得到矩阵B。

关于B是什么：

总之，我们可以由原本空间中样本间的距离矩阵求得B矩阵。

对B做特征值分解 B= VAVT, 这里V是特征向量矩阵、A是由特征值构成的对角阵。

此时，把A中的特征值排序后，把其中每个非0特征值拿出来构成对角矩阵，其对应的特征向量也需按特征值的大小改变排列顺序，组成新的特征向量矩阵。

最终，通过如下公式完成降维操作。（这个公式怎么来的我也不明啊，痛苦?）

另外，在现实应用中为了有效降维，往往只需要降维后两样本间的距离应尽可能和原空间中两样本的距离相近就好了，不需要强行一致，因此上面特征值构成的对角阵和特征向量矩阵由了一些变化。

变化为：本来特征值取的是所有非0的特征值排序。现在变成我排序好后，从大到小取特征值与其对应的特征向量。比如我要降维到5维，我就从大到小取5个特征值。 ok‘

虽然解释的不清楚，但是，这个就给自己看好了，作为下次复习的提纲。

88～

就叫温华啦

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
降维之 MDS算法的直觉

为什么需要降维呢？因为啊，在高维空间中，如果要满足密采样，那么需要的样本数就太多了，惹不起惹不起，（比如，1维时填充单位空间需要三个样本， 2维时填充单位空间需要九个样本，3维时需要27个。。。。。。那么 100维就需要3^100个样本，这就太可怕了。）另外，高维空间中的距离是特别奇怪的。为什么能降维呢？这是因为在很多时候，人们观察或收集到的很多样本虽是高维的，但...
复制链接

扫一扫

专栏目录

就叫温华啦 CSDN认证博客专家 CSDN认证企业博客

码龄8年

104: 原创

31万+: 周排名

126万+: 总排名

5万+: 访问

: 等级

1534: 积分

28: 粉丝

33: 获赞

17: 评论

57: 收藏

私信

关注

分类专栏

最新评论

爬虫之数据存储（txt、json、csv）
Tisfy: 深得人心，正如古人云：读书不作儒生酸，跃马西入金城关。
降维之 MDS算法的直觉
廿—念: 这个公式的意思是不是指Z矩阵是d维的？就是说已经降维成功了叭
左神基础班-图的生成、bfs、dfs
qq_45698200: 大佬我的编译器怎么运行不了啊，增强for循环那里error C2143: 语法错误 : 缺少“,”(在“:”的前面)
左神基础课 - 克鲁斯卡尔算法-生成最小生成树
姜蒋酱7: 已经读懂了
左神基础课 - 克鲁斯卡尔算法-生成最小生成树
姜蒋酱7: [code=cpp] priority_queue<Edge,vector<Edge>,greater<Edge> > [/code] 请问这一句优先队列的定义是什么意思呢

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。