语言建模
语言建模(language modeling)就是预测句子中下一个出现的单词的任务。更精确的说法是,给定已经出现的所有词,求下一个次出现的概率分布。
P ( w t + 1 ∣ w 1 , . . . , w t ) P(w_{t+1}|w_1,...,w_t) P(wt+1∣w1,...,wt)
语言模型
传统模型
假设当前词与之前所有的词有关。
P ( w 1 , w 2 , . . . , w T ) = ∏ t = 1 T P ( w t ∣ w 1 , . . . , w t − 1 ) P(w_1, w_2, \ ...\ , w_T) = \prod_{t=1}^T P(w_t | w_{1}, \ ...\ , w_{t-1}) P(w1,w2, ... ,wT)=