Neural Network Language Model(NNLM)神经网络语言模型
原理图:
运用场景:
知道句子的前N-1个词,来预测第N个词。
网络的流程:
1.词语one-hot编码—————2.projection_layer层————3.hidden_layer层——————4.SoftMax层
-
词语One-hot编码
句子:“我爱自然语言处理”
词库为:”我,爱,自然,语言,处理,........”
因此词语 "我" 的one-hot编码为:[1,0,0,0,0,0...,0]
词语 "爱" 的one-hot编码为:[0,1,0,0,0,0...,0]
词语 "自然" 的one-hot编码为:[0,0,1,0,0,0...,0]
词语 "语言" 的one-hot编码为:[0,0,0,1,0,0...,0]
-
projection_layer
熟称投影层
投影矩阵C,其中词典的维数为V,假设V=10000
则投影矩阵C为: