onehot和tensorflow中的embedding_lookup有什么关系，为什么词向量会在每一次训练迭代时更新

最新推荐文章于 2024-07-25 17:32:42 发布

xuke100

最新推荐文章于 2024-07-25 17:32:42 发布

阅读量3.4k

点赞数 1

分类专栏： python 深度学习 tensorflow

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xuke100/article/details/80675712

版权

深度学习同时被 3 个专栏收录

6 篇文章 0 订阅

订阅专栏

5 篇文章 0 订阅

订阅专栏

2 篇文章 0 订阅

订阅专栏

onehot和embedding_lookup的关系，可以参考这里

主要讲一下，为什么每一次训练迭代，词向量就会更新一次：embedding_lookup不是简单的查表，id对应的向量是可以训练的，训练参数个数应该是 category num*embedding size，也就是说lookup是一种全连接层。啥意思？

1.先解释一下onehot：

onehot：onehot是通常用来处理文字的数据的方法，比如‘我喜欢你’（假设所有的训练数据就是这4个字）对应的onehot就是 [1000 0100 0010 0001]，但是这样的矩阵丢进算法里会造成专家所说的数据太稀疏，因为训练数据肯定会有很多个，矩阵稀疏是我能想到的原因。

2. 如何解决onehot产生的矩阵过于稀疏的问题？——引出为什么词向量会在训练的每一次迭代时更新的原因：

embedding_look_up来救场，我们用一个去全连接层去和onehot矩阵相乘，那么就会出现，下面的情况：

[W11 W12 W13

[1000 W21 W22 W23 [W11 W12 W13

0100] X W31 W32 W33 = W21 W22 W23] 这样是很明显的全连接层的做法，而每一次训练，词向量会变化，是因为

W41 W42 W44]

我们将Wn1 Wn2 Wn3.......作为对应N词的词向量，当然全连接层的W在训练由于反向传播更新参数。

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。