今天来简单总结一下TSNE~
SNE
首先来说说SNE,全称为随机相邻嵌入(Stochastic Neighbor Embedding),其将数据之间的高维的欧几里得距离转化为表示相似性的条件概率:数据点 x j x_j xj与数据点 x i x_i xi的相似性表示为条件概率的样子 p j ∣ i p_{j|i} pj∣i,表达为 x i x_i xi选择 x j x_j xj作为邻居,表达式为:
p j ∣ i = e x p ( − ∣ ∣ x i − x j ∣ ∣ 2 / 2 σ i 2 ) ∑ k ≠ i e x p ( − ∣ ∣ x i − x k ∣ ∣ 2 / 2 σ i 2 ) p_{j|i}=\frac{exp(-||x_i-x_j||^2/2\sigma_i^2)}{\sum_{k\neq i}exp(-||x_i-x_k||^2/2\sigma_i^2)} pj∣i=∑k=iexp(−∣∣xi−xk∣∣2/2σi2)exp(−∣∣xi−xj∣∣2/2σi2)
其中 σ i \sigma_i σi是 x i x_i xi为中心的高斯分布的方差。( p i ∣ i = 0 p_{i|i}=0 pi∣i=0)
当我们把高维数据映射到低维空间中时,我们要保证其数据分布应与原来的相同,或者说是数据点之间的相似性相同。那么设刚刚数据点