论文:arXiv:1301.3781
一:论文解决了什么问题?
- 提出了两种新的模型架构,用于计算来自非常大的数据集的单词的连续向量表示。
- 本文的主要目标是介绍一些技术,这些技术可以用于从包含数十亿个单词和词汇中的数百万个单词的巨大数据集中学习高质量的单词向量。
二:论文是怎样解决问题?
1.CBOW模型主要通过周围的词来预测中心的词
2.Skip-gram模型通过中心词来预测周围的词
论文:arXiv:1301.3781