word2vec的梳理

最新推荐文章于 2023-09-21 21:05:05 发布

要努力的鱼～

最新推荐文章于 2023-09-21 21:05:05 发布

阅读量205

点赞数 2

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43643246/article/details/104964416

版权

简介

word2vec包含两个模型，跳字模型（skip-gram）和连续词袋模型（CBOW），以及两种高效的训练方法：负采样和层序softmax。

模型

CBOW 根据上下文的词来预测中心词在这里插入图片描述
分为三层：
输入层：我们上下文窗口中包含的词
举个例子：I like my new bike 这句话中，假设中心词my, I like 是上文词，new bike是下文词。那么我们输入层对应的就是这四个词的one-hot形式。

投影层：可以理解为隐藏层，将上下文的词汇表示进行线性变换后累加求和求平均。将多个向量变成一个向量。

输出层：以文本中出现过的词当做叶子结点，以各词出现的次数当做权值，来构建Huffman树。如果词表中有D个词，则有D个叶子结点。

在这里插入图片描述

内部细节：

输入的是该中心词对应的2m个上下文词（one-hot）
假设词表有1000个单词，那么每个单词对应的shape=[1,1000],其中有一位为1.
我们最后希望的稠密词向量的维度为300维，那么初始化一个W

最低0.47元/天解锁文章

要努力的鱼～

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
word2vec的梳理

简介word2vec包含两个模型，跳字模型（skip-gram）和连续词袋模型（CBOW），以及两种高效的训练方法：负采样和层序softmax。模型CBOW 根据上下文的词来预测中心词分为三层：输入层：我们上下文窗口中包含的词举个例子：I like my new bike 这句话中，假设中心词my, I like 是上文词，new bike是下文词。那么我们输入层对应的就是这四个词的...
复制链接

扫一扫

专栏目录

要努力的鱼～ CSDN认证博客专家 CSDN认证企业博客

码龄6年

37: 原创

32万+: 周排名

133万+: 总排名

4万+: 访问

: 等级

801: 积分

14: 粉丝

62: 获赞

15: 评论

120: 收藏

私信

关注

热门文章

分类专栏

最新评论

gradient_accumulation_steps
Y元素: 直接减小Batch size可能会导致损失震荡，用梯度累加来曲线救国避免通过减小batch_size而减少显存
Bert实战--文本分类(一)
咸鱼中上游: 请问可以给一下数据集吗？
【文本分类】TextCNN的实现
wenyun_!: 大佬，可否发个打包的project哇
gradient_accumulation_steps
lizhzh8: 清晰易懂
【论文翻译】UNSUPERVISED DATA AUGMENTATION FOR CONSISTENCY TRAINING
Xu_Wave: 总结的很棒 UDA这样的缝合怪的确贴合工业一点

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。