一、复习
二、C&W模型
上面的公式可以理解为一个损失函数
预测的越正确,loss就越小
三、CBOW模型(连续词袋模型)
句子: i love you
输入:i you 输出(预测):love
上下文词向量预测(加和平均)作为中间词的词向量
CBOW把词向量进行平均后得到输出层(无隐藏层)
左边:CBOW 右边:Skip-gram
四、Skip-gram模型
中间的词向量预测左右词的词向量
上面的公式可以理解为一个损失函数
预测的越正确,loss就越小
句子: i love you
输入:i you 输出(预测):love
上下文词向量预测(加和平均)作为中间词的词向量
CBOW把词向量进行平均后得到输出层(无隐藏层)
左边:CBOW 右边:Skip-gram
中间的词向量预测左右词的词向量