怎么形象理解embedding这个概念？

最新推荐文章于 2024-02-20 13:34:38 发布

程程程

最新推荐文章于 2024-02-20 13:34:38 发布

阅读量258

点赞数

原文链接：https://www.zhihu.com/question/38002635

版权

作者：到处挖坑蒋玉成
链接：https://www.zhihu.com/question/38002635/answer/1046650109
来源：知乎
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

我觉得 @邱锡鹏老师的《神经网络与深度学习》里对这个的解释比较容易理解——实际上对颜色的RGB表示法就属于一种典型的分布式表示：在这里插入图片描述对于颜色，我们可以把它拆成三个特征维度，用这三个维度的组合理论上可以表示任意一种颜色。同理，对于词，我们也可以把它拆成指定数量的特征维度，词表中的每一个词都可以用这些维度组合成的向量来表示，这个就是Word Embedding的含义。当然，词跟颜色还是有很大的差别的——我们已经知道表示颜色的三个维度有明确对应的物理意义（即RGB），直接使用物理原理就可以知道某一个颜色对应的RGB是多少。但是对于词，我们无法给出每个维度所具备的可解释的意义，也无法直接求出一个词的词向量的值应该是多少。所以我们需要使用语料和模型来训练词向量——把嵌入矩阵当成模型参数的一部分，通过词与词间的共现或上下文关系来优化模型参数，最后得到的矩阵就是词表中所有词的词向量。这里需要说明的是，有的初学者可能没绕过一个弯，就是“最初的词向量是怎么来的”——其实你只要知道最初的词向量是瞎JB填的就行了。嵌入矩阵最初的参数跟模型参数一样是随机初始化的，然后前向传播计算损失函数，反向传播求嵌入矩阵里各个参数的导数，再梯度下降更新，这个跟一般的模型训练都是一样的。等训练得差不多的时候，嵌入矩阵就是比较准确的词向量矩阵了。编辑于 2020-02-29

程程程

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
怎么形象理解embedding这个概念？

作者：到处挖坑蒋玉成链接：https://www.zhihu.com/question/38002635/answer/1046650109来源：知乎著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。我觉得 @邱锡鹏老师的《神经网络与深度学习》里对这个的解释比较容易理解——实际上对颜色的RGB表示法就属于一种典型的分布式表示：对于颜色，我们可以把它拆成三个特征维度，用这三个维度的组合理论上可以表示任意一种颜色。同理，对于词，我们也可以把它拆成指定数量的特征维度，词表中的每一个词都
复制链接

扫一扫