Word2vec Skip-gram算法的核心部分 我们做什么来计算一个词在中心词的上下文中出现的概率? 似然函数 词已知,它的上下文单词的概率 相乘。 然后所有中心词的这个相乘数 再全部相乘,希望得到最大。 目标函数(代价函数,损失函数) 平均对数似然 + 转化为极小化问题 最小化目标函数 J(θ) <==> 最大化预测的准确性 为了简化数学和优化,每个单词都用两个向量表示