本篇内容翻译自Speech and Language Processing. Daniel Jurafsky & James H. Martin.
链接:https://web.stanford.edu/~jurafsky/slp3/
不愧是自然语言处理领域的圣经,读起来流畅自然,以后还是要多读经典。
困惑度(Perplexity, PP)用来评估一个语言模型的好坏。
我们知道语言模型是用来计算一个句子的概率,但实际中,我们不会使用原始的概率作为语言模型的度量。
1. 公式定义
给定测试集 W = w 1 w 2 . . . w N W = w_1w_2...w_N W=w1w2..