神经网络语言模型NNLM解决的一大问题:
维度灾难:由于向量维度过大,导致模型计算量爆炸。
NNLM经典模型图如下所示:
其中, C ( i ) C(i) C(i)表示第i个词的词向量, g g g代表可以使用的神经网络,在NNLM中,假设当前词是与前n-1个词有关系的。
图一代表的公式其实是下式:
y = b + W x + U t a n h ( d + H x ) y=b+Wx+Utanh(d+Hx) y=b+Wx+Utanh(d+Hx)
其中x被使用了两次,分别对应图一中上半部分的实线和虚线。