2021李宏毅机器学习笔记--18Unsupervised Learning -- Neighbor Embedding

最新推荐文章于 2024-07-11 13:14:28 发布

guoxinxin0605

最新推荐文章于 2024-07-11 13:14:28 发布

阅读量506

点赞数 2

文章标签：机器学习可视化深度学习无监督学习

本文链接：https://blog.csdn.net/guoxinxin0605/article/details/119276027

版权

本文深入探讨无监督学习中的流形学习，重点关注局部线性嵌入（LLE）和t分布随机邻居嵌入（t-SNE）。LLE保持降维前后点与点的线性关系，而t-SNE利用t分布优化降维后的相似度，尤其适用于数据可视化。通过对比分析，揭示了这两种方法在高维数据降维和可视化中的作用。

摘要由CSDN通过智能技术生成

2021李宏毅机器学习笔记--18 Unsupervised Learning -- Neighbor Embedding

摘要
一、Manifold Learning(流形学习)
二、Locally Linear Embedding(LLE,局部线性嵌入)
三、Laplacian Eigenmaps(拉普拉斯特征映射)
四、t-SNE（T-distributed Stochastic Neighbor Embedding,t分布随机邻居嵌入）
- 4.1 简介
- 4.3 应用
五、Similarity Measure(相似性度量)
总结

摘要

本节是进行非线性降维的一些算法。包括局部线性嵌入LLE、拉普拉斯特征映射和t分布随机邻居嵌入t-SNE，其中t-SNE特别适用于可视化的应用场景。t-SNE其中NE就是Neighbor Embedding的缩写。

一、Manifold Learning(流形学习)

样本点的分布可能是在高维空间里的一个流形(Manifold)，也就是说，样本点其实是分布在低维空间里面，只是被扭曲地塞到了一个高维空间里

常见的例子就是地球，地球的表面就是一个流形(Manifold)，它是一个二维的平面，但是被塞到了一个三维空间里

如下图左，在一个高维的S形的空间图形中，如何判断几个点之间的距离。在Manifold中，只有距离很近的点欧氏距离(Euclidean Distance)才会成立，而在下图的S型曲面中，欧氏距离是无法判断两个样本点的相似程度的

而Manifold Learning要做的就是把这个S型曲面降维展开，把塞在高维空间里的低维空间摊平，此时使用欧氏距离就可以描述样本点之间的相似程度。
在这里插入图片描述

二、Locally Linear Embedding(LLE,局部线性嵌入)

局部线性嵌入，locally linear embedding，简称LLE

假设在原来的空间中，样本点的分布如下所示，我们关注 $x^i$ 和它的邻居 $x^j$ ，用 $w_{ij}$ 来描述 $x^i$ 和 $x^j$ 的关系

假设每一个样本点 $x^i$ 都是可以用它的neighbor做linear combination组合而成，那 $w_{ij}$ 就是拿 $x^j$ 去组合 $x^i$ 时的权重weight，因此找点与点的关系 $w_{ij}$ 这个问题就转换成，找一组使得所有样本点与周围点线性组合的差距能够最小的参数 $w_{ij}$

在这里插入图片描述
接下来就要做Dimension Reduction，把 $x^i$ 和 $x^j$ 降维到 $z^i$ 和 $z^j$ ，并且保持降维前后两个点之间的关系 $w_{ij}$ 是不变的。

LLE的具体的步骤如下所示：

1、在原先的高维空间中先找到 $x^i$ 和 $x^j$ 之间的关系 $w_{ij}$ 以后就把它固定住

在这里插入图片描述

2、使 $x^i$ 和 $x^j$ 降维到新的低维空间上的 $z^i$ 和 $z^j$

3、 $z^i$ 和 $z^j$ 需要minimize下面的式子：

在这里插入图片描述
即在原本的空间里 $x^i$ 可以由周围点通过参数 $w_{ij}$

最低0.47元/天解锁文章

guoxinxin0605

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
2021李宏毅机器学习笔记--18Unsupervised Learning -- Neighbor Embedding

2021李宏毅机器学习笔记--18 Unsupervised Learning -- Neighbor Embedding 摘要一、Manifold Learning(流形学习)二、Locally Linear Embedding(LLE,局部线性嵌入)三、Laplacian Eigenmaps(拉普拉斯特征映射)3.1 简介二级目录二级目录四、总结二级目录三级目录摘要wijw_{ij}wijwiw^iwi本节是进行非线性降维的一些算法。包括局部线性嵌入LLE、拉普拉斯特征映射和t分布随
复制链接

扫一扫