Isomap数据降维算法学习

最新推荐文章于 2024-08-27 12:57:23 发布

爱你在每天

最新推荐文章于 2024-08-27 12:57:23 发布

阅读量1.2k

点赞数 1

文章标签：算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44792274/article/details/121083340

版权

本文介绍了Isomap算法，一种非线性降维技术。该算法利用测地线距离替代欧式距离，适用于分布在流形上的非线性数据。文章详细阐述了Isomap的三个核心步骤：确定邻域、构建距离矩阵及应用MDS算法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档

Iosamp算法

一、数据降维
二、Isomap
三、构建Isomap的三个步骤
总结
参考论文

一、数据降维

研究大量高维数据时，需要从中提取出有意义的低维结构，便于进行进一步的数据分析，例如在日常生活中，人脑通过3000根听觉神经和10e6根视觉神经提取出少量与感知相关的特征。

之前常用的方法有PCA(Principal Component Analysis,主成分分析)和MDS(multidimensional scaling,多维尺度分析)，但这些传统方法中的数据点和数据点之间的距离和映射函数都是定义在欧式空间中的，但实际上这些数据点可能不是分布在欧式空间中的，因此传统欧式空间的度量难以用于真实世界的非线性数据。

二、Isomap

Isomap(等距特征映射)方法是假设显示情况中非线性数据的分布位于内嵌欧式距离的流形体上，其中的关键在于数据点之间的距离用测地线距离来代替欧氏距离。

如下图所示两个用黑色圆圈表示的数据点，他们的欧式距离表示为虚线所示，测地线距离则为实曲线所示
分布在流行体上的数据集

三、构建Isomap的三个步骤

1.确定流形上的邻域

根据输入的数据点，对于某一点i，确定数据点集中的哪些点是其邻域点，有两个建档的方法，一个是确定邻域半径R，如果某一点j与i之间的距离度量（如欧式距离）小于R，则认为点j是i的邻域点，另一种方法是KNN，即找到k个与i点最近的点，即为i的邻域。这样，我们可以构建一个连通图，其中每个点只和距离这个点的邻域点直接连接，和其他的点不直接连接

2.构建距离矩阵

通过构建的Isomap图，求所有数据点之间的最短距离，可采用Dikstra算法或Floyd 算法，计算数据集中任意两点之间的距离，构建N×N的空间距离矩阵，第i行第j列代表第i个数据和第j个数据之间的距离

3.MDS算法

根据2中得到的空间距离矩阵，使用MDS算法得到最后的降维矩阵结果

总结

简单对Isomap算法进行了介绍，有兴趣可以看看Science源论文

参考论文

https://www.science.org/doi/abs/10.1126/science.290.5500.2319

爱你在每天

博客等级

码龄6年

6
原创

9
点赞

59
收藏

5
粉丝

关注

私信

热门文章

最新评论

在VMware中Ubuntu18中使用vscode编写c++程序的配置过程及可能遇到的问题
CSDN-Ada助手: 非常感谢用户分享的这篇博客，对于在VMware中Ubuntu18中使用vscode编写c++程序的配置过程及可能遇到的问题进行了详细的讲解，非常有帮助。同时也恭喜用户能够坚持不懈的写作，希望用户能够继续保持这种创作热情，分享更多的技术经验和心得体会。未来的创作建议是可以结合自己的实践经验，分享更多的实用技巧和解决问题的方法，让更多的读者受益。再次感谢用户的分享，期待更多的精彩作品！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply7 看奖励名单。
在VMware中Ubuntu18中使用vscode编写c++程序的配置过程及可能遇到的问题
CSDN-Ada助手: 恭喜用户写出了这篇有关在VMware中Ubuntu18中使用vscode编写c++程序的配置过程及可能遇到的问题的博客，这篇文章对于那些初学者来说是非常有帮助的。下一步的创作建议是可以写一篇有关在其他操作系统中使用vscode编写c++程序的配置过程及可能遇到的问题的文章，这样可以帮助更多的人。谦虚的建议，期待更多的优秀文章。 CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply7 看奖励名单。
C++对根据时间对txt文件进行命名，并进行读写，分别运用FILE和fstrem进行输出
盼盼编程: 厉害了！顶！

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。