参考:
https://blog.csdn.net/u014665013/article/details/79642083
这个人的博客其他内容也很值得看以下
对公式的解释和理解很不错
glove和skip-gram与cbow不同,后两者是基于窗口信息和神经网络建立的求词向量的模型,而glove没有用到神经网络,他是基于共现矩阵建立的。即给词向量赋予合适的值,使得词向量符合共现矩阵的某些性质,从而代替共现矩阵(共现矩阵也可以表示词,且能够反映词间的一些关系,即相近的词对应的向量之间距离小,但是共现矩阵的特点是维度太大,且稀疏,因此需要用glove来使其维度降低)。