一、统计语言模型 1.性能评价:困惑度 平滑的n-gram模型句子的概率: 假定测试语料T由lT个句子构成 则整个测试集的概率为: 模型对于测试语料的交叉熵:,其中,WT是测试文本T的词数。 模型p的困惑度定义为