
模型的目的是训练一个神经语言模型,即给定n-1个单词,预测第n个单词是什么。词向量是过程中得到的副产品。
模型说明:
step1: 矩阵C是V×d,也就是上面提到的词向量矩阵。每一个用one-hot表示的单词投影到其对应的词向量。然后拼接起来得到XXX,XXX的维度是d(n−1)d(n-1)
本文主要探讨了神经语言模型的训练过程,模型旨在预测给定n-1个单词后的第n个单词。通过词向量矩阵C进行one-hot编码的单词投影,并利用tanh激活函数进行计算,最终通过softmax进行概率分布预测。

模型的目的是训练一个神经语言模型,即给定n-1个单词,预测第n个单词是什么。词向量是过程中得到的副产品。
模型说明:
step1: 矩阵C是V×d,也就是上面提到的词向量矩阵。每一个用one-hot表示的单词投影到其对应的词向量。然后拼接起来得到XXX,XXX的维度是d(n−1)d(n-1)
2360
315
2033

被折叠的 条评论
为什么被折叠?