word2vec资料汇总

论文阅读

word2vec是基于单词的上下文语境学习单词的词向量表示的一种技术,相比于one-hot编码高维、稀疏的特点,word2vec可以学习到低维、连续的词向量表示,同时编码的词向量可以很好的度量单词的语义相似性。相关论文可以参考:Efficient Estimation of Word Representations in Vector Space

模型解析

为了学习单词分布式的词向量表示,word2vec提出了两种模型CBOWSkip-gram,其中CBOW是基于单词的上下文单词预测中心单词,而Skip-gram刚好相反,基于中心单词预测单词的上下文。另外,为了加快模型学习的速度,文中提出了两种技术hierarchical softmaxnegative sampling。详细的参考资料:word2vec 中的数学原理详解

模型实战

word2vec使用工具包括gensim和fasttext两种,其中gensim使用可以参考:gensim Word2Vec 训练和使用,而fasttext的使用可以参考:Word representations

参考文献

  1. https://arxiv.org/abs/1301.3781v3
  2. https://www.cnblogs.com/peghoty/p/3857839.html
  3. https://blog.csdn.net/qq_19707521/article/details/79169826
  4. https://fasttext.cc/docs/en/unsupervised-tutorial.html
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值