迅速了解Embedding层的作用

最新推荐文章于 2024-09-18 03:47:27 发布

工藤旧一

最新推荐文章于 2024-09-18 03:47:27 发布

阅读量4.6k

点赞数 10

分类专栏： # CTR

本文链接：https://blog.csdn.net/weixin_45459911/article/details/105254667

版权

CTR 专栏收录该内容

28 篇文章 5 订阅

订阅专栏

在阅读深度学习类论文的时候，经常会见到embedding这个名词，却一直不知道其具体含义是什么，遂查询了很多资料，终于明白了其作用，记录于此，希望能帮助对此同样疑惑的人。

1、在讲embedding之前必须要先说一下独热编码（one-hot），如果你已经对其有一定了解，可以跳过这一段。

独热编码（one-hot）的作用很简单，就是把特征全都用0、1来表示，直接看个例子：
有四类人：老年人、中年人、青年、幼儿
将其用独热编码进行表示
老年人：1000
中年人：0100
青年：0010
幼儿：0001

可以看到每一类人都有一个一维数组（列表）与之对应，这个对应数组的特点就是只有一位是1，其余全是0。

经过one-hot，我们原有的一位数组（列表）

[‘老年人’，‘中年人’，‘青年’，‘幼儿’]

转化为了一个二维稀疏矩阵

[
[1000]
[0100]
[0010]
[0001]
]

看到这里，有部分长得比较帅的人可能就会问了：为什么要这么转换呢？
因为计算简单。
没错，稀疏矩阵做矩阵运算的时候，只需要把1对应位置的数相乘求和就行，要比列表计算简单的多。one-hot编码的优势就是计算方便快捷、表达能力强。

此时，另一部分长得比较帅的人可能会问：有得必有失，独热编码的副作用是什么呢？
空间占用过大
比如我要统计某网络交易平台的商品，那得成千上万件，再经过独热编码，那空间大的还得了？

那该怎么解决空间过大的问题呢？
——Embedding！

2、Embedding的作用
先来看张图片
（图片来自https://spaces.ac.cn/archives/4122）
在这里插入图片描述
这是一个简单的矩阵乘法，一个2 x 6的矩阵，然后乘上一个6 x 3的矩阵后，变成了一个2 x 3的矩阵。
注意注意注意！
就仅仅利用一个简单的矩阵相乘，一个12个元素的矩阵变成了6个元素的矩阵，瞬间缩小一半。