无监督学习t-SNE(t-distributed stochastic neighbor embedding)

t-SNE

1.t-SNE主要是用来对高维数据进行降维可视化,它是一种非线性降维算法
2.t-SNE将点与点之间的相似度转换为条件概率
  
  对于原始高维数据 x i x^i xi x j x^j xj之间的相似率:
P ( x j ∣ x i ) = S ( x i , x j ) ∑ k ≠ i S ( x i , x k ) \begin{aligned} P(x^j|x^i) = \frac{S(x^i,x^j)}{\sum_{k\neq i}S(x^i,x^k)} \end{aligned} P(xjxi)=k̸=iS(xi,xk)S(xi,xj)
  对于降维之后的数据 z i z^i zi z j z^j zj相似概率:
Q ( z j ∣ z i ) = S ′ ( x i , x j ) ∑ k ≠ i ( z i , z k ) Q(z^j|z^i) = \frac{S^\prime(x^i,x^j)}{\sum_{k\neq i}(z^i, z^k)} Q(zjzi)=k̸=i(zi,zk)S(xi,xj)
3.计算出 P ( x j ∣ x i ) P(x^j|x^i) P(xjxi) Q ( z j ∣ z i ) Q(z^j|z^i) Q(zjzi)之后,我们需要使得 P P P Q Q Q的连接分布最接近,也就是 K L KL KL散度尽可能的小。
L = ∑ i K L ( P ( ∗ ∣ x i ) ∣ ∣ Q ( ∗ ∣ z j ) ) = ∑ i ∑ j P ( x j ∣ x i ) l o g P ( x j ∣ x i ) Q ( x j ∣ x i ) \begin{aligned} L&=\sum_iKL\left(P\left(*|x^i\right)||Q\left(*|z^j\right)\right)\\ &=\sum_i\sum_jP(x^j|x^i)log\frac{P(x^j|x^i)}{Q(x^j|x^i)} \end{aligned} L=iKL(P(xi)Q(zj))=ijP(xjxi)logQ(xjxi)P(xjxi)

参考
无监督学习之t-SNE
李宏毅t-SNE

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值