深入理解 Embedding层的本质

最新推荐文章于 2025-04-10 10:07:01 发布

罗小丰同学

最新推荐文章于 2025-04-10 10:07:01 发布

阅读量1.4w

点赞数 269

分类专栏： python 算法 cnn 文章标签： NPL 词嵌入 CNN

本文链接：https://blog.csdn.net/weixin_42078618/article/details/84553940

版权

继上文https://blog.csdn.net/weixin_42078618/article/details/82999906探讨了embedding层的降维效果，时隔一个月，分享一下嵌入层在NPL领域的巨大作用。

本文的发表建立在了解文本转向量（如one-hot）的用法的前提上。

首先，继续假设我们有一句话，叫“公主很漂亮”，如果我们使用one-hot编码，可能得到的编码如下：

公 [0 0 0 0 1]
主 [0 0 0 1 0]
很 [0 0 1 0 0]
漂 [0 1 0 0 0] 
亮 [1 0 0 0 0]

咋一眼看过似乎没毛病，其实本来人家也没毛病，或者假设咱们的词袋更大一些

公 [0 0 0 0 1 0 0 0 0 0]
主 [0 0 0 1 0 0 0 0 0 0]
很 [0 0 1 0 0 0 0 0 0 0]
漂 [0 1 0 0 0 0 0 0 0 0] 
亮 [1 0 0 0 0 0 0 0 0 0]

假设吧，就假设咱们的词袋一共就10个字，则这一句话的编码如上所示。

这样的编码，最大的好处就是，不管你是什么字，我们都能在一个一维的数组里用01给你表示出来。并且不同的字绝对不一样，以致于一点重复都没有，表达本征的能力极强。

但是，因为其完全独立，其劣势就出来了。表达关联特征的能力几乎为0！！！

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

罗小丰同学

关注关注

269
点赞
踩
382

收藏

觉得还不错? 一键收藏
23
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

神经网络 Embedding层理解； Embedding层中使用预训练词向量

weixin_42357472的博客

10-21

9829

Embedding：高维稀疏特征向量到低维稠密特征向量的转换；嵌入层将正整数（下标）转换为具有固定大小的向量 Embedding 字面理解是 “嵌入”，实质是一种映射，从语义空间到向量空间的映射，同时尽可能在向量空间保持原样本在语义空间的关系，如语义接近的两个词汇在向量空间中的位置也比较接近。应用：在深度学习推荐系统中，Embedding主要的三个应用方向： 1、在深度学习网络中作为Embedding层，完成从高维稀疏特征向量到低维稠密特征向量的转换； 2、作为预训练的Embedding特征向量，与其

01-Embedding层是什么？怎么理解？简单的评论情感分类实验

Serendipity_zyx的博客

05-01

2389

文章目录1. One-hot编码2. Embedding3. 语义理解中Embedding意义4. 文本评论（代码实验） 1. One-hot编码要知道embedding的作用，首先要了解独热编码（one-hot）。假设现在有如下对应关系：那么，就可以用 [0，1，4] 来表示“我是猪”这句话。而One-hot中只存在0和1，有多少个字要编码，one-hot一行的长度就为这么多。比如一个字典中只有“我是一头猪”5个字被从0-4进行了编码，那么one-hot每一行就会有5个用0或1表示的位置，即使要表

23 条评论您还未登录，请先登录后发表或查看评论

9000字。一文看懂Embedding模型

最新发布

Python_cocola的博客

04-10

1441

Embedding模型是一种将离散的符号数据（如单词、句子、图像等）映射到连续的向量空间中的技术，这些向量能够捕捉数据之间的语义、结构等关系。简单来说，就是把原本难以直接处理的符号数据，转换成计算机更容易理解和操作的数值向量形式。以自然语言处理中的词嵌入（Word Embedding）为例，传统的语言处理方法中，单词通常以独热编码（One - Hot Encoding）的形式表示，即一个单词对应一个长长的向量，向量中只有一个位置是1，其余位置都是0，用来唯一标识这个单词。

embedding层_keras-Embedding层

weixin_39940425的博客

11-24

387

嵌入层（Embedding Layer）是使用在模型第一层的一个网络层，其目的是将所有索引标号映射到致密的低维向量中，比如文本集[[4],[32],[67]]被映射为[[0.3,0.9,0.2],[-0.2,0.1,0,8],[0.1,0.3,0.9]]。该层通常用于文本数据建模。输入数据要求是一个二维张量：(1个批次内的文本数,每篇文本中的词语数)，输出为一个三维张量：(1个批次内的文本数, 每...

深度学习中的Embedding（嵌入）层

qq_54708219的博客

03-04

4906

Embedding（嵌入）层深度解析

细说NLP中的Embedding层

weixin_46034279的博客

06-07

2004

在构建高效的自然语言处理模型时，Embedding层是不可或缺的组成部分。它不仅可以帮助我们捕获词汇之间的语义关系，还能提高模型的性能。在本篇博客中，我们将详细介绍Embedding层的基本原理、使用方法以及它在深度学习框架中的实现，帮助你更好地理解和应用这一技术。

Embedding层的理解

qq_35284646的博客

01-22

8143

嵌入层的理解 Embedding

深度学习embedding方法，降维，以及pytorch中使用embedding

weixin_41106546的博客

04-24

8205

形式上讲，Embedding就是用。

深入解析 Transformers 框架（五）：嵌入（Embedding）机制和 Word2Vec 词嵌入模型实战

老牛啊

12-13

2579

本文深入探讨了 Transformers 框架中词嵌入（Token Embeddings）的关键作用和实现细节，展示了将离散符号映射至连续向量空间的过程。通过具体代码示例，我们揭示了 Qwen2.5-1.5B 大模型中嵌入矩阵的工作原理，并演示了如何将文本序列转换为嵌入向量。此外，文章还介绍了经典的 Word2Vec 技术，使用 gensim 库训练模型并进行词汇相似性分析，以便更好地理解和应用自然语言处理中的嵌入技术……

前言本文将从Embedding的本质、Embedding的原理、Embedding的应用三个方面，带您一文搞懂Embedding（嵌入）。

08-15

前言部分，Embedding（嵌入）主要涉及以下几个方面： 1. **本质**[^4]: ...深入理解Embedding，可以从实际项目中实践，比如训练自己的词嵌入模型或者在预训练的模型（如BERT）中观察嵌入向量的行为。[^6]

神经网络算法 - 一文搞懂Embedding（嵌入）

weixin_53880910的博客

08-03

4355

本文将从**Embedding的本质、Embedding的原理、Embedding的应用**三个方面，带您一文搞懂Embedding（嵌入）。

深度学习 Embedding层两大作用 - 转载

ac540101928的专栏

12-24

1567

1. one-hot概念首先，我们有一个one-hot编码的概念。假设，我们中文，一共只有10个字。那么我们用0-9就可以表示完。比如，这十个字就是“我从哪里来，要到何处去”。其分别对应“0-9”，如下：我从哪里来要到何处去 0 1 2 3 4 5 6 7 8 9 那么，其实我们只用一个列表就能表示所有的对话如：我从哪里来要到何处去 ——>>>[0 ...

Embedding小结

生命不息，Coding不止

09-03

898

Word2Vec Tutorial Idea Word2Vec 是一个可以将单词转换为固定维度向量的工具。 Two model Skip-Gram(SG) 基本思想给定中心词，去预测窗口范围内的词。例如给定句子：{...,"prolems", "turning", ’into", ’banking", "crises’, "as",...} 给定窗口 m=2m = 2m=2 ，中心...

【embedding 神经网络】神经网络算法 —— Embedding（嵌入）！！

python12222_的博客

07-02

2377

本文将从 Embedding 的本质、Embedding的原理、Embedding的应用三个方面，详细介绍Embedding（嵌入）。

【Transformer系列】深入浅出理解Embedding（词嵌入）

IT菜鸟

09-15

1万+

【Transformer系列】深入浅出理解Embedding（词嵌入）

什么是Embedding？

星辰的博客

04-05

6593

Embedding,中文直译为“嵌人”，常被翻译为“向量化”或者“向量映射”。 Embedding的主要作用是将稀疏向量转换成稠密向量，便于上层深度神经网络处理。事实上，Embedding技术的作用远不止于此，它的应用场景非常多元化，而且实现方法也各不相同。形式上讲Embedding就是用一个低维稠密的向量“表示”一个对象(object), 这里所说的对象可以是一个词、一个商品，也可以是一部电影，等等。 Embedding技术在NLP领域的应用 Embedding方法的流行始于自然语言处理领域对于词向量生成

什么是embedding？