word2vec代码_word2vec的前世今生

最新推荐文章于 2024-08-16 15:57:51 发布

weixin_39571087

最新推荐文章于 2024-08-16 15:57:51 发布

阅读量152

点赞数

文章标签： word2vec代码 word2vec原理

思想：Representing words by their context

Distributional semantics ：⼀个单词的意思是由经常出现在它附近的单词给出的

“You shall know a word by the company it keeps” (J. R. Firth 1957: 11)
现代统计NLP最成功的理念之⼀，有点物以类聚，⼈以群分的感觉
当⼀个单词出现在⽂本中时，它的上下⽂是出现在其附近的⼀组单词(在⼀个固定⼤⼩的窗⼝中)。

Word2vec (Mikolov et al. 2013)是⼀个学习单词向量的框架IDEA：

我们有⼤量的⽂本 (corpus means 'body' in Latin. 复数为corpora)
固定词汇表中的每个单词都由⼀个向量表示
⽂本中的每个位置，其中有⼀个中⼼词和上下⽂(“外部”)单词
使⽤和的词向量的相似性来计算给定的的概率 (反之亦然)
不断调整词向量来最⼤化这个概率

Word2vec objective function

Word2vec 是⼀个软件包实际上包含：

两个算法：continuous bag-of-words（CBOW）和 skip-gram。CBOW 是根据中⼼词周围的上下⽂单词来预测该词的词向量。skip-gram 则相反，是根据中⼼词预测周围上下⽂的词的概率分布。
两个训练⽅法：negative sampling 和 hierarchical softmax。Negative sampling 通过抽取负样本来定义⽬标，hierarchical softmax 通过使⽤⼀个有效的树结构来计算所有词的概率来定义⽬标。

参考资料

徐啸：[CS224n笔记] L1 Introduction and Word Vectorszhuanlan.zhihu.com

这一篇是CS224n的笔记，损失函数推导很详尽，内容以课件为主。

天雨粟：理解 Word2Vec 之 Skip-Gram 模型zhuanlan.zhihu.com

这一篇全是干货

天雨粟：基于TensorFlow实现Skip-Gram模型zhuanlan.zhihu.com

上一篇的实战篇，看了代码你啥都知道了

我想我是她的海：一篇浅显易懂的word2vec原理讲解zhuanlan.zhihu.com

补充CBOW的知识

张云：关于word2vec，我有话要说zhuanlan.zhihu.com

实际训练word2vec过程中会遇到的问题

一文搞懂短小精悍的全能fastTextmp.weixin.qq.com

fasttext

TianMin：word2vec中的负采样与分层softmaxzhuanlan.zhihu.com

负采样和分层softmaxt

weixin_39571087

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。