word2vec资料汇总

最新推荐文章于 2024-02-20 17:09:35 发布

naive_zhang

最新推荐文章于 2024-02-20 17:09:35 发布

阅读量311

点赞数

分类专栏： deep_learning

本文链接：https://blog.csdn.net/naive_zhang/article/details/107286542

版权

deep_learning 专栏收录该内容

4 篇文章

订阅专栏

论文阅读

word2vec是基于单词的上下文语境学习单词的词向量表示的一种技术，相比于one-hot编码高维、稀疏的特点，word2vec可以学习到低维、连续的词向量表示，同时编码的词向量可以很好的度量单词的语义相似性。相关论文可以参考：Efficient Estimation of Word Representations in Vector Space 。

模型解析

为了学习单词分布式的词向量表示，word2vec提出了两种模型CBOW和Skip-gram，其中CBOW是基于单词的上下文单词预测中心单词，而Skip-gram刚好相反，基于中心单词预测单词的上下文。另外，为了加快模型学习的速度，文中提出了两种技术hierarchical softmax和negative sampling。详细的参考资料：word2vec 中的数学原理详解。