语言模型的评估与困惑度

最新推荐文章于 2024-08-22 14:34:26 发布

人间再无张居正

最新推荐文章于 2024-08-22 14:34:26 发布

阅读量423

点赞数

分类专栏：秋来落叶声

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013887652/article/details/102655838

版权

秋来落叶声专栏收录该内容

12 篇文章 0 订阅

订阅专栏

声明

本文无个人理解，只是对比国内和国外资料后对国内博客中困惑度的一个补充。如果你无法访问参考文献2，这里提供一个下载链接。

链接：https://pan.baidu.com/s/1lllc-cMBGLdbKaGgnBdX3A&shfl=sharepset
提取码：ekzm

语言模型VS语言模型

训练好一个语言模型后，怎样评估语言模型的好坏呢？可以使用困惑度(perplexity)！困惑度越小，则语言模型越优。

困惑度的定义

形式一：
$P(w_1w_2...w_N )^{-\frac{1}{N}}$
上面的式子中 $W$ 为一句话， $w_1w_2...w_N$ 为构成这句话的词，为求解上面的式子，可以将上面的联合概率展开，并使用不同的假设，比如Unigram，bigram等。

形式二：
$2^{-\sum_{i=1}^N \frac{1}{N} \log_2 q(x_i)}$
上式中q分布为形式一中展开联合分布后每一项的分布表示。可以对比参考文献1和参考文献3中的内容体会。

参考文献

人间再无张居正

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
语言模型的评估与困惑度

声明本文无个人理解，只是对比国内和国外资料后对国内博客中困惑度的一个补充。如果你无法访问参考文献2，这里提供一个下载链接。链接：https://pan.baidu.com/s/1lllc-cMBGLdbKaGgnBdX3A&shfl=sharepset 语言模型VS语言模型训练好一个语言模型后，怎样评估语言模型的好坏呢？可以使用困惑度(perplexity)！困惑度越小，则语言模型...
复制链接

扫一扫

专栏目录

人间再无张居正 CSDN认证博客专家 CSDN认证企业博客

码龄11年

73: 原创

8万+: 周排名

227万+: 总排名

9万+: 访问

: 等级

1403: 积分

5: 粉丝

32: 获赞

13: 评论

103: 收藏

私信

关注

热门文章

分类专栏

最新评论

远程访问clickhouse
Happy_Saint: 好像可以： cclickhouse-client --host 你的IP --port 9000（你的默认端口）
对于Attention机制中Q，K，V的一些理解
lmw0320: 没有说清楚Q，K，V具体是什么鬼啊？？我的理解是: Q是指输出端的句子，其每个向量所组成的向量组。Q的维度是一个矩阵，n x d, n代表输出句子的长度（也就是单词的数量），d是代表向量组中每个向量的维度（这个一般是人为设定的，维度越高表达的信息越丰富，但是也不能太高，否则计算量太大）； V是指输入端的句子，其每个向量所组成的向量组。维度是m x t, m同样代表输入句子的长度，t则是代表向量组中每个向量的维度，与前面的Q其实是类似的。--d和t中的每个向量，都是代表一个单词或词组。 K是指输入端句子的每个向量，对应的各种权重。--K的维度是d x m。由于计算公式近似是Q*K）*V，最终结果会是n x t
Python退出多重循环的方法
当然我依旧爱你: tql,简直精美
Python退出多重循环的方法
ctotalk: 收了
分布式锁
不正经的kimol君: 大佬的文章让我受益匪浅，如痴如醉，以后的日子还希望能够得到大佬的谆谆指点！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。