聚类分析 | Python非线性降维t-SNE

10 篇文章 2 订阅 ¥19.90 ¥99.00
本文介绍了t-SNE非线性降维技术,用于保持数据点之间的相似性关系,特别是在数据可视化和聚类分析中。通过Python的Scikit-Learn库,对Iris数据集进行t-SNE处理,并可视化了不同类别的鸢尾花在2D空间中的分布,展示t-SNE在揭示数据结构和聚类方面的效果。
摘要由CSDN通过智能技术生成

-SNE是一种非线性降维技术,其核心思想是将高维数据映射到低维空间,同时尽量保持数据点之间的相似性关系。

t-SNE在数据可视化和探索中非常有用,可以帮助我们发现数据中的聚类、结构和异常值。

主要原理包括:

相似度度量:t-SNE使用高维数据中数据点之间的相似性度量,通常是高斯分布的概率密度函数。较相似的数据点将具有较高的概率值,而不相似的数据点将具有较低的概率值。

低维映射:t-SNE创建一个低维嵌入,将高维数据映射到低维空间。该映射的目标是最小化高维空间中数据点对的相似性概率与低维空间中数据点对的相似性概率之间的差异。

t分布:t-SNE使用t分布(t-distribution)来表示相似性概率。t分布具有长尾(fat-tailed)性质,这使得在低维空间中相似的数据点之间有更大的距离,从而有助于保持聚类。

使用Python和Scikit-Learn库来进行t-SNE降维和可视化。

使用Iris鸢尾花数据集,该数据集包含了三个不同种类的鸢尾花的特征。

导入所需的库

import numpy as np
import matplotlib.pyplot as plt
from sklearn import datasets
from sklearn.manifold import TSNE

加载Iris数据集

iris = datasets.load_iris()
X = iris.data
y = iris.target

使用t-SNE进行降维

tsne = TSNE(n_components=2,

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

天天酷科研

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值