通俗理解一个常用的降维算法

最新推荐文章于 2024-01-17 11:20:30 发布

算法channel

最新推荐文章于 2024-01-17 11:20:30 发布

阅读量1.3k

点赞数

本文链接：https://blog.csdn.net/xo3ylAF9kGs/article/details/103193853

版权

这是第325篇原创

1 t-SNE 背景介绍

最易被我们视觉观察到的维数是一维，二维和三维，四维及以上用图形表达都不会那么直观。

然而，现实情况却是随意拿个数据集，都有上千上百个维度。比如，经典的MNIST维度是64，所以使用二维的笛卡尔坐标系，注定无法绘制64个维度。

当我们想对高维数据集进行分类，但又不清楚这个数据集有没有很好的可分性（同类之间间隔小、异类之间间隔大）时，可以通过降维算法将数据投影到二维或三维空间中。

很久以前，就有人提出一种降维算法，主成分分析(PCA) 降维法，中间其他的降维算法陆续出现，比如多维缩放(MDS)，线性判别分析(LDA)，等度量映射(Isomap)。

等时间来到2008年，另外一个和我们比较熟悉的大牛 Geoffrey Hinton在 2008 年一同提出了t-SNE 算法。

他们改进SNE算法为t-SNE算法，并使它在降维领域得到更广泛的应用。

2 t-SNE 算法概述

全称为 t-distributed Stochastic Neighbor Embedding，翻译为 t分布-随机邻近嵌入。

怎么理解这个名字？</

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

算法channel

关注关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
通俗理解一个常用的降维算法

这是第325篇原创1 t-SNE 背景介绍最易被我们视觉观察到的维数是一维，二维和三维，四维及以上用图形表达都不会那么直观。然而，现实情况却是随意拿个数据集，都有上千上百...
复制链接

扫一扫

KL散度解释——来自COUNT BAYESIE

MiaLove

05-20

980

KL散度解释——来自COUNT BAYESIE 本文来自Count Bayesie https://www.countbayesie.com/blog/2017/5/9/kullback-leibler-divergence-explained 原文翻译：在这篇文章中，我们将看一下比较两个概率分布的方法，称为Kullback-Leibler Divergence（通常简写为KL散度或KL距离）。...

KL散度的通俗易懂理解

kaggle expert，全球排名前1000，清华计算机研究生，兴趣算法工程

04-18

1万+

一、第一种理解　　　　相对熵（relative entropy）又称为KL散度（Kullback–Leibler divergence，简称KLD），信息散度（information divergence），信息增益（information gain）。　　KL散度是两个概率分布P和Q差别的非对称性的度量。 KL散度是用来度量使用基于Q的编码来编码来自P的样本平...

参与评论您还未登录，请先登录后发表或查看评论

降维的应用

种花生的博客

07-09

823

主成分分析算法的过程：重建压缩： PCA算法的错误使用：

机器学习算法学习---降维技术（一）

weixin_33860737的博客

05-27

214

降维是对数据高维度特征的一种预处理方法。降维是将高维度的数据保留下最重要的一些特征，去除噪声和不重要的特征，从而实现提升数据处理速度的目的。在实际的生产和应用中，降维在一定的信息损失范围内，可以为我们节省大量的时间和成本。降维也成为了应用非常广泛的数据预处理方法。除了方便显示外，对数据降维还有如下原因：（1）使得数据集更易使用（2）降低算法的计算开销（3）去除噪声（4）使得结果容易理解常...

降维算法之PCA：从原理到应用，8000多字，助你彻底理解！

ZuHaohua的博客

06-20

1万+

本文首先使用数形结合介绍了PCA的原理，推导了PCA的公式；之后介绍了实现PCA算法的两种具体方式；最后使用sklearn库应用了PCA对图像数据进行降维。

如何通俗的解释机器学习的10大算法？.docx

07-10

本文将通俗地解释十个常见的机器学习算法，帮助非专业人员理解它们的基本概念和应用。 1. 逻辑回归：逻辑回归主要用于二分类问题，比如预测用户是否会点击广告。它通过构建一个线性函数，然后用激活函数（Sigmoid）...

如何通俗的解释机器学习的10大算法？.pdf

07-10

本文将通俗地解释十个常见的机器学习算法，帮助非专业人员理解它们的基本概念和应用。 1. 逻辑回归：逻辑回归主要用于二分类问题，比如预测用户是否会点击广告。它通过构建一个线性函数，然后用Sigmoid函数将其转化...

机器学习两种方法——监督学习和无监督学习(通俗理解).pdf

07-09

在监督学习中，算法的目标是从训练数据中学习一个函数，这个函数能够将新的、未见过的输入映射到相应的输出。例如，如果我们有一个包含图像和对应标签（如猫、狗等）的训练集，监督学习算法将尝试找出图像特征与类别...

fish 算法的matlab版本

06-27

从标题和描述来看，“fish算法”可能并不是一个广泛认可的标准算法名称，但从代码上下文推测，这里所谓的“fish算法”实际上可能是对Fisher判别分析的一种通俗叫法。Fisher判别分析是一种经典的线性判别方法，主要...

PCA主成分分析介绍，通俗易懂，最后附带matlab代码

03-30

本文旨在提供一个通俗易懂的PCA介绍，并附带MATLAB实现示例。 #### 二、基础知识概述在深入探讨PCA之前，我们先了解一些必要的数学概念，包括标准差、协方差、特征向量和特征值等。这些概念对于理解PCA非常关键。...

KL散度 JS散度

阳光zfc

10-14

615

转发：https://www.jianshu.com/p/43318a3dc715?from=timeline&isappinstalled=0 https://en.wikipedia.org/wiki/Jensen%E2%80%93Shannon_divergence

【机器学习】KL-divergence（KL散度）的理解

weixin_43693967的博客

10-21

714

相对熵（relative entropy），又被称为Kullback-Leibler散度（Kullback-Leibler divergence）或信息散度（information divergence），是两个概率分布（probability distribution）间差异的非对称性度量。

机器学习：KL散度详解

最新发布

weixin_44210987的博客

01-17

820

当我们考虑两个分布时，概率比的对数（即 log(Q(x) / P(x) )提供了一个衡量从Q到P的视角下信息增益或惊讶度变化的方法。直观理解：最后，使用概率比可以提供一种直观的方式来理解一个事件在一个分布中的重要性相对于另一个分布的变化。如果你根据分布Q预测事件，而真实分布是P，KL散度就告诉你，平均而言，你的预测有多么“出乎意料”。其中 ( X ) 是所有可能事件的集合，( P(x) ) 和 ( Q(x) ) 分别是事件 ( x ) 在两个分布中的概率。P(x)−Q(x) 时，我们得到的是绝对差异。

kl散度学习笔记python实现

jacke121的专栏

08-06

3977

KL Divergence KL（ Kullback–Leibler） Divergence中文译作KL散度，从信息论角度来讲，这个指标就是信息增益（Information Gain）或相对熵（Relative Entropy），用于衡量一个分布相对于另一个分布的差异性，注意，这个指标不能用作距离衡量，因为该指标不具有对称性，即两个分布PP和QQ，DKL(P|Q)DKL(P|Q)与DKL(Q|P)DKL(Q|P)计算的值一般不相等，若用作距离度量，一般需要对公式加以修改，后文讲到。 KL Diverg...

pytorch识别手写数字（MNIST）

m0_73899012的博客

11-07

144

此文章用于记录学习进度#

模式识别第7、8章特征的选择和提取

qq_53826699的博客

12-16

3899

特征→ 特征空间：每一个特征对应特征空间的一个维度；特征越多，特征空间的维度越高原则：在保证分类效果的前提下用尽量少的特征来完成分类基本概念（1）特征形成：由仪器直接测量出来的数值，或者是根据仪器的数据进行计算后的结果（2）特征选择：用计算的方法从一组给定的特征中选择一部分特征进行分类（3）特征提取：通过适当的变换把原有的D个特征转换为d（

KL散度的稳定性与优缺点

禅与计算机程序设计艺术

12-30

1023

1.背景介绍 KL散度（Kullback-Leibler Divergence），也被称为相对熵或相对信息，是一种衡量两个概率分布之间差异的度量标准。它主要用于信息论、统计学、机器学习等领域。KL散度的核心思想是，给定两个概率分布P和Q，P是真实分布，Q是估计分布，KL散度表示从Q转换到P的最小信息损失。 KL散度的计算公式为：

PRML-系列一之1.6.1

蜗牛

05-16

1061

通俗解读：10大机器学习核心算法详解

在《如何通俗的解释机器学习的10大算法？》这份PDF文档中，作者试图以简单易懂的方式介绍机器学习领域的核心算法，以帮助读者更好地理解和应用这些技术。以下是关于10大算法的详细解读： 1. 逻辑回归：作为一种基础...