聚类分析 | Python非线性降维t-SNE

天天酷科研

于 2023-10-28 19:42:16 发布

阅读量241

点赞数

分类专栏：聚类分析算法（CLA）建模与仿真（ML&Simulink）文章标签： python 信息可视化 t-SNE

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2301_79294434/article/details/134095291

版权

建模与仿真（ML&Simulink）同时被 2 个专栏收录

38 篇文章 13 订阅 ¥39.90 ¥99.00

订阅专栏

聚类分析算法（CLA）

10 篇文章 2 订阅 ¥19.90 ¥99.00

订阅专栏

本文介绍了t-SNE非线性降维技术，用于保持数据点之间的相似性关系，特别是在数据可视化和聚类分析中。通过Python的Scikit-Learn库，对Iris数据集进行t-SNE处理，并可视化了不同类别的鸢尾花在2D空间中的分布，展示t-SNE在揭示数据结构和聚类方面的效果。

摘要由CSDN通过智能技术生成

-SNE是一种非线性降维技术，其核心思想是将高维数据映射到低维空间，同时尽量保持数据点之间的相似性关系。

t-SNE在数据可视化和探索中非常有用，可以帮助我们发现数据中的聚类、结构和异常值。

主要原理包括：

相似度度量：t-SNE使用高维数据中数据点之间的相似性度量，通常是高斯分布的概率密度函数。较相似的数据点将具有较高的概率值，而不相似的数据点将具有较低的概率值。

低维映射：t-SNE创建一个低维嵌入，将高维数据映射到低维空间。该映射的目标是最小化高维空间中数据点对的相似性概率与低维空间中数据点对的相似性概率之间的差异。

t分布：t-SNE使用t分布（t-distribution）来表示相似性概率。t分布具有长尾（fat-tailed）性质，这使得在低维空间中相似的数据点之间有更大的距离，从而有助于保持聚类。

使用Python和Scikit-Learn库来进行t-SNE降维和可视化。

使用Iris鸢尾花数据集，该数据集包含了三个不同种类的鸢尾花的特征。

导入所需的库

import numpy as np
import matplotlib.pyplot as plt
from sklearn import datasets
from sklearn.manifold import TSNE

加载Iris数据集

iris = datasets.load_iris()
X = iris.data
y = iris.target

使用t-SNE进行降维

tsne = TSNE(n_components=2,

了解本专栏

天天酷科研

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
聚类分析 | Python非线性降维t-SNE

聚类分析 | Python非线性降维t-SNE
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

天天酷科研 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。