无监督学习:机器学习中的 t-随机邻域嵌入(t-SNE)

t-SNE(t-分布随机邻域嵌入)是一种无监督机器学习算法,用于高维数据集的降维,特别是在复杂数据集如语音识别、图像处理和NLP中。它通过保持相似数据点在低维空间的接近性来减少变量数量。t-SNE的工作流程包括计算高维空间中点的成对相似性,将其映射到低维空间,并使用梯度下降优化低维表示,最小化Kullback-Leibler散度。与PCA相比,t-SNE更适用于保持局部结构。
摘要由CSDN通过智能技术生成

概述

机器学习是计算机科学中最热门的话题之一。这是因为这个世界上每天涌入的数据是巨大的。由于每天都有如此多的数据出现,因此需要控制并从所述数据中生成见解。因此,许多方法正在世界范围内不断改进机器学习技术。

创建机器学习模型时最常见的问题之一是要处理大量变量。由于大多数真实世界的数据集不是以模型友好的方式处理的,因此我们大多数时候都需要处理和过滤掉我们的数据集。在大多数情况下,数据集中有许多自变量会让开发人员感到困难,因为我们对要选择哪些列感到困惑。

先决条件

为了充分利用本文,

  • 读者必须熟悉机器学习中的自变量和因变量。
  • 条件概率和样本空间等概率的基本概念必须清晰。

介绍

正如我们之前所讨论的,降维是机器学习工程师最常处理的问题之一。使用大量自变量不仅会增加我们计算模型的时间,而且还会增加机器学习模型的整体复杂性。PCA(主成分分析)和 t-SNE(t 分布随机邻域嵌入)等工具帮助我们减少整体变量,并帮助我们确定哪些变量对模型构建很重要。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

新华

感谢打赏,我会继续努力原创。

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值