On the Continuity of tSNE Gradients Under Kernel Pertur

AI天才研究院

已于 2024-01-18 17:40:47 修改

阅读量607

点赞数 1

分类专栏： AI实战 AI大模型原生应用构建与大数据架构实践 Python实战文章标签：大数据人工智能语言模型 Java Python 架构设计

于 2023-10-13 02:38:42 首次发布

本文链接：https://blog.csdn.net/universsky2015/article/details/133802353

版权

AI大模型原生应用构建与大数据架构实践同时被 3 个专栏收录

该专栏为热销专栏榜第37名

37044 篇文章 ¥69.90 ¥99.00

订阅专栏

超级会员免费看

Python实战

6682 篇文章 ¥39.90 ¥99.00

订阅专栏

超级会员免费看

AI实战

5208 篇文章 ¥39.90 ¥99.00

订阅专栏

超级会员免费看

本文探讨了t-SNE在高维数据降维中的应用，特别是使用kernel trick解决非线性关系的问题。针对局部收敛和断裂现象，文章介绍了非参数高斯核的连续性保证和随机重启策略，同时讲解了算法的数学模型和具体实现，旨在提升t-SNE的性能和稳定性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

作者：禅与计算机程序设计艺术

1.背景介绍

t-SNE (t-Distributed Stochastic Neighbor Embedding) 是一种经典的非线性降维方法。在高维空间中，原有的样本点分布可能会发生严重的扭曲，而通过 t-SNE 将高维数据转化成低维空间后，分布会得到较好的保持。t-SNE 的关键是计算每个高维数据点的邻近质量（neighborhood similarity）并映射到低维空间，这里的邻近质量可以定义为高维数据点对其他高维数据点的“内积”或者“相似度”。基于这种邻近质量函数的不同选择，t-SNE 可以用于许多领域，包括科研、推荐系统、图像分析、生物信息等方面。
t-SNE 使用了最优化算法寻找每个高维数据的低维表示，其中迭代更新梯度（gradient update），根据高维数据点及其对应的低维表示之间的关系计算梯度，然后更新低维表示使得这些距离最小。但是，由于数据存在非线性关系，导致求解梯度困难。为了解决这个问题，提出了 kernel trick，即用核技巧将高维数据映射到低维空间，从而将距离度量变成一个非线性函数，这样就可以通过计算高维数据点对其他高维数据点的内积来计算邻近质量，进而进行计算梯度。
然而，基于 kernel trick 的 t-SNE 在某些情况下仍然存在一些问题，如局部收敛和断裂现象。在这些情况下࿰