T SNE降维matlab程序,关于t-SNE降维方法

本文详细介绍了t-SNE(t-distributed Stochastic Neighbor Embedding)降维方法,包括其原理、问题、参数、实验工具TensorBoard以及在MNIST数据集上的应用。t-SNE通过转换数据点之间的相似度来降低维度,适用于保持数据的局部结构。文章讨论了t-SNE的高计算复杂度、随机性以及关键参数如困惑度和学习率。在TensorFlow中,t-SNE的参数包括输出维度和困惑度等。实验中,作者使用TensorBoard进行可视化,并展示了MNIST数据集在二维和三维空间的降维结果,与PCA进行了对比。
摘要由CSDN通过智能技术生成

关于t-SNE降维方法

论文原图是这样的:

324e607f59ee

image.png

1. 什么是t-SNE:

全名是t-distributed Stochastic Neighbor Embedding(t-SNE),翻译过来应该可以叫学生t分布的随机邻点嵌入法。

t-SNE将数据点之间的相似度转换为概率。原始空间中的相似度由高斯联合概率表示,嵌入空间的相似度由“学生t分布”表示。t-SNE在一些降维方法中表现得比较好。因为t-SNE主要是关注数据的局部结构。

通过原始空间和嵌入空间的联合概率的Kullback-Leibler(KL)散度来评估可视化效果的好坏,也就是说用有关KL散度的函数作为loss函数,然后通过梯度下降最小化loss函数,最终获得收敛结果。

正式点来描述就是:

给定一组

math?formula=N 个点

math?formula=x_1%2C%20%5Ccdots%2C%20x_N%20%5Cin%20%5Cmathbb%7BR%7D%5Ed, t-SNE 首先计算

math?formula=x_i

math?formula=x_j之间的相似度

math?formula=p_%7Bij%7D。这个相似度公式定义为:

math?formula=p_%7Bij%7D%20%3D%20(p_%7Bi%20%5Cmid%20j%7D%20%2B%20p_%7Bj%20%5Cmid%20i%7D)%2F(2N)

对于每个

math?formula=i都有

math?formula=p_%7Bj%20%5Cmid%20i%7D%20%5Cpropto%20%5Cexp(%5C%7Cx_i-x_j%5C%7C%5E2%2F%5Csigma_i%5E2) ,这里就是用的高斯核了,只涉及到一个参数

math?formula=%5Csigma_i.

for some parameter

math?formula=%5Csigma_i. Intuitively, the value

math?formula=p_%7Bij%7D measures the `similarity' between points

math?formula=x_i and

math?formula=x_j. t-SNE then aims to learn the lower dimensional points

math?formula=y_1%2C%20%5Ccdots%2C%20y_N%20%5Cin%20%5Cmathbb%7BR%7D%5E2 such that if

math?formula=q_%7Bij%7D%20%5Cpropto%20(1%2B%5C%7Cy_i-y_j%20%5C%7C_2%5E2)%5E%7B-1%7D, then

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值