自然语言

最新推荐文章于 2024-07-16 11:39:48 发布

syqxiaoer

最新推荐文章于 2024-07-16 11:39:48 发布

阅读量657

点赞数 1

本文链接：https://blog.csdn.net/syqxiaoer/article/details/80644916

版权

自然语言模型

一个句子的概率
$P(s)= p(w_1,w_2,...w_m) =$ $p(w_1)p(w_2|w_1) ...p(w_m| w_1,w_2,...w_{m-1})$
n-gram模型又一个假定，就是当前单词出现概率仅仅与前面n-1个单词相关。 $p(S)=p(w_1,w_2,...w_m)=\prod_{i=1}^mp(w_{i-n+1},...w_{i-1})$ 其中n表示当前单词依赖它前面的单词的个数。 $p(w_{i-n+1},...w_{i-1})=\frac{C(w_{i-n+1},...w_{i-1},w_i)}{C(w_{i-n+1},...w_{i-1})}$ 其中C(X)表示单词序列在训练语料库中出现的次数。

评估指标

语言模型常用的评估指标为复杂度perplexity,它刻画的是通过某一语言模型估计的一句话出现的概率。比如当已经知道 $(w_1, w_2,...w_m)$ 这句话出现在语料库中，那么通过语言模型计算出得出这个句子得概率越高越好，也就是perplexity得值越低越好：

P e r p l e x i t y (S) = p (w 1, w 2, . . . w m) 1 m = 1 p ( w 1 , w 2 , . . . w m ) - - - - - - - - - - - - - - \sqrt m = \prod i = 1 m 1 p ( w i | w 1 , w 2 , . . . w i - 1 ) - - - - - - - - - - - - - - - - - - - - \sqrt m

$Perplexity(S)=p(w_1, w_2,...w_m)^\frac{1}{m}=\sqrt[m]{\frac{1}{p(w_1, w_2,...w_m)}}=\sqrt[m]{\prod_{i=1}^m\frac{1}{p(w_i|w_1,w_2,...w_{i-1})}}$
复杂度表示的是平均分支系数，即预测下一个词时平均可选择数量。
另一种常用的perplexity表达形式