t-SNE聚类可视化

最新推荐文章于 2024-03-03 19:40:27 发布

niu妮妮

最新推荐文章于 2024-03-03 19:40:27 发布

阅读量420

点赞数

文章标签：聚类数据挖掘机器学习

本文链接：https://blog.csdn.net/niu_nini/article/details/129843806

版权

t-SNE是一种用于降维和可视化的算法，尤其适用于高维数据。它能保持数据点的局部关系，将数据映射到2D或3D空间。通过使用TSNE进行转换，然后利用scatterplot展示结果，可以清晰地观察数据的聚类结构。

摘要由CSDN通过智能技术生成

t-SNE（t-distributed stochastic neighbor embedding）是一种用于降维和可视化高维数据的算法，通常用于聚类分析。t-SNE能够将高维数据点映射到一个低维空间中（通常是2D或3D），并且能够保留数据点之间的局部关系，同时尽量降低全局误差。因此，t-SNE可用于数据可视化，以便观察聚类结果

只要将你要可视化的网络层数据丢进plot_tsne()中

def plot_tsne(features, labels,k):
    '''
    features:(N*m) N*m大小特征，其中N代表有N个数据，每个数据m维
    label:(N) 有N个标签
    '''
    import pandas as pd
    import seaborn as sns

    tsne = TSNE(n_components=2, init='pca', perplexity=3,  n_iter=300, random_state=42, learning_rate='auto', n_jobs=7)
    class_num = len(np.unique(labels))  # 要分类的种类个数  eg:[0, 1, 2, 3]这个就是为4 
    tsne_features = tsne.fit_transform(features)  
    print('tsne_features的shape:', tsne_features.shape)

    df = pd.DataFrame()
    df["y"] = labels
    df["comp-1"] = tsne_features[:, 0]
    df[&