word2vec是如何得到向量的（CBOW模型）

最新推荐文章于 2023-10-29 09:00:00 发布

MHY的CH

最新推荐文章于 2023-10-29 09:00:00 发布

阅读量463

点赞数 1

分类专栏： NLP 文章标签：深度学习自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43433969/article/details/103524940

版权

这篇博客记录了word2vec的CBOW模型，通过上下文预测中心词，介绍了模型的权重矩阵、输入输出过程及算法加速技巧，旨在理解和应用词向量。

摘要由CSDN通过智能技术生成

学习笔记

只是自己的学习笔记，只把自己要记忆的知识写下来。
简单理解的链接： word2vec是如何得到向量的

word2vec的准备操作：中文需要将每句话用工具分词（jieba等）

word2vec的作用：是将语料库中的词训练出各自的词向量，供NLP其他后续具体任务的使用。

word2vec的处理方法：两种训练方法CBOW模型和Skip-gram模型。]

word2vec的算法加速方法：Negative Sample与Hierarchical Softmax

1.CBOW模型根据中心词W(t)周围的词来预测中心词
2.Skip-gram模型则根据中心词W(t)来预测周围词

在这里插入图片描述

上图中两个矩阵是CBOW模型要不断学习迭代的: $W_{v*n}$

最低0.47元/天解锁文章

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
word2vec是如何得到向量的（CBOW模型）

学习笔记只是自己的学习笔记，只把自己要记忆的知识写下来。word2vec的准备操作：**word2vec的作用：、是将语料库中的词训练出各自的词向量，供NLP其他后续具体任务的使用。...
复制链接

扫一扫

专栏目录

MHY的CH CSDN认证博客专家 CSDN认证企业博客

码龄6年

31: 原创

11万+: 周排名

146万+: 总排名

2万+: 访问

: 等级

570: 积分

9: 粉丝

24: 获赞

18: 评论

67: 收藏

私信

关注

热门文章

分类专栏

数学建模 1篇
剑指offer 28篇
python 14篇
java 9篇
NLP 14篇
论文 5篇
springboot 1篇

最新评论

Bert简单理解——原理与介绍
银釭照君: BERT官方模型要跑多久
code2seq代码复现运行笔记pytorch版本
Elena_fy: 可以求一份datasets文件吗？那个datasets文件链接打不开了。
中文文本分类 FastText-pytorch
Song Ringo: 大佬啊大佬
中文文本分类 FastText-pytorch
北风催呀催: 没有GPU也能训练吗，为啥我一训练就CUDA out of memory，除非batch_size=1
code2seq代码复现运行笔记pytorch版本
weixin_45579572: [code=python] [Traceback (most recent call last): File "G:/come again/新建文件夹/code2seq-master/notebooks/c2s.py", line 685, in <module> batch_S, batch_N, batch_E, batch_Y, lengths_S, lengths_N, lengths_E, lengths_Y, max_length_S, max_length_N, max_length_E, max_length_Y, lengths_k, index_N = next( File "G:/come again/新建文件夹/code2seq-master/notebooks/c2s.py", line 181, in __next__ raise StopIteration() StopIteration]

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。