无监督学习：机器学习中的 t-随机邻域嵌入（t-SNE）

最新推荐文章于 2024-10-07 16:07:33 发布

新华

最新推荐文章于 2024-10-07 16:07:33 发布

阅读量79

点赞数

分类专栏：机器学习文章标签：学习机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/mzgxinhua/article/details/135005507

版权

机器学习专栏收录该内容

63 篇文章 1 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

t-SNE（t-分布随机邻域嵌入）是一种无监督机器学习算法，用于高维数据集的降维，特别是在复杂数据集如语音识别、图像处理和NLP中。它通过保持相似数据点在低维空间的接近性来减少变量数量。t-SNE的工作流程包括计算高维空间中点的成对相似性，将其映射到低维空间，并使用梯度下降优化低维表示，最小化Kullback-Leibler散度。与PCA相比，t-SNE更适用于保持局部结构。

摘要由CSDN通过智能技术生成

概述

机器学习是计算机科学中最热门的话题之一。这是因为这个世界上每天涌入的数据是巨大的。由于每天都有如此多的数据出现，因此需要控制并从所述数据中生成见解。因此，许多方法正在世界范围内不断改进机器学习技术。

创建机器学习模型时最常见的问题之一是要处理大量变量。由于大多数真实世界的数据集不是以模型友好的方式处理的，因此我们大多数时候都需要处理和过滤掉我们的数据集。在大多数情况下，数据集中有许多自变量会让开发人员感到困难，因为我们对要选择哪些列感到困惑。

先决条件

为了充分利用本文，

读者必须熟悉机器学习中的自变量和因变量。
条件概率和样本空间等概率的基本概念必须清晰。

介绍

正如我们之前所讨论的，降维是机器学习工程师最常处理的问题之一。使用大量自变量不仅会增加我们计算模型的时间，而且还会增加机器学习模型的整体复杂性。PCA（主成分分析）和 t-SNE（t 分布随机邻域嵌入）等工具帮助我们减少整体变量，并帮助我们确定哪些变量对模型构建很重要。

了解本专栏

超级会员免费看

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

新华 感谢打赏，我会继续努力原创。

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。