sklearn.manifold.TSNE 函数
官网:https://scikit-learn.org/stable/modules/generated/sklearn.manifold.TSNE.html
t-SNE是一种可视化高维数据的工具。它将数据点之间的相似性转化为联合概率,并试图最小化低维嵌入和高维数据的联合概率之间的Kullback-Leibler散度。t-SNE有一个非凸的代价函数,即不同的初始化可以得到不同的结果。
强烈建议使用另一种降维方法(如PCA用于密集数据或TruncatedSVD用于稀疏数据),以便在特征数非常高的情况下将维数降到合理的数量(如50)。这将抑制一些噪声并加快样本之间成对距离的计算。
参数:
n_components : int, default=2 | 嵌入空间的尺寸。 |
---|---|
perplexity : float, default=30.0 | 复杂度与其他流形学习算法中使用的最近邻数有关。更大的数据集通常需要更大的复杂性。考虑选择一个介于5和50之间的值。不同的值可能导致显著不同的结果 |
early_exaggeration : float, default=12.0 | 控制原始空间中的自然簇在嵌入空间中的紧密程度以及它们之间的空间大小。对于较大的值,嵌入空间中自然簇之间的空间较大。同样,这个参数的选择不是很关键。在初始优化过程中,如果代价函数增大,则早期的夸大因子或学习率可能过高。 |
learni |