NLP知识点 - perplexity 困惑度

最新推荐文章于 2025-04-12 19:26:34 发布

_春天_

最新推荐文章于 2025-04-12 19:26:34 发布

阅读量4.9k

点赞数 18

分类专栏：自然语言处理文章标签：自然语言处理人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42294274/article/details/134976384

版权

(一) Perplexity

困惑度（Perplexity，缩写为PPL）是衡量语言模型好坏的一个常用指标。

语言模型（language model）是用来预测句子中的next word的概率分布（probability distribution），并计算一个句子的概率。一个好的语言模型，应该给well-written 的句子更高的生成概率，阅读这些句子不应该让人感到困惑。

困惑度的定义：

$perplexity(W)=P(w_1w_2...w_n)^{-\frac{1}{N}}$
在语言模型在测试集 $W=\{w_1, w_2, ..., w_N\}$ 上的困惑度，是测试集的逆概率，然后用单词数量进行归一化。

核心思想是，句子的概率越大，其困惑度越小，说明语言模型越好。

（二）Perplexity with Example

假设我们的语言模型，词表只有[“a”, “the”, “red”, “fox”, “dog”, “.”] 六个词。

下面计算“a red fox.”这句话 $W$ 的概率。

$P(W)=P(w_1w_2...w_n)$
所以：
$P(a\ red\ fox.)=P(a)*P(red|a)*P(fox|a\ red)*P(.|a \ red\ fox)$

假设：
句子中首字的概率如下：
$P(w_1=a)=0.4$
$P(w_1=the)=0.3$

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。