本文翻译原链接:https://towardsdatascience.com/t-sne-clearly-explained-d84c537f53a
什么是t-SNE?
t-sne被称为非线性降维,这意味着允许我们分离任何不能用直线分离的数据。主要用于理解高维数据并将其投影到低维空间(2D或3D),使得它在处理CNN网络时非常有用。
它如何工作?
概率分布
以这张图为例子:
从坐标图可以看出它有三类,你可以很容易的区分出(根据坐标)。算法的第一部分是创建概率分布代表“相似度”,什么是相似度? 论文是是这样说的:“ similarity of datapoint xⱼ to datapoint xᵢ is the conditional probability p_{j|i}, that xᵢ would pick xⱼ as its neighbor “
我们从图中选择一个点,我们必须再选择下一个点计算欧氏距离|Xi-Xj|,论文的下一部分是计算高斯分布。如图所示:
对其他所有点做类似操作
未完待续。。。