nlp入门6——语言模型任务评估

qishanbaby

于 2023-09-23 14:34:21 发布

阅读量199

点赞数

分类专栏： nlp 文章标签：自然语言处理语言模型人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qishanbaby/article/details/133202077

版权

nlp 专栏收录该内容

11 篇文章 0 订阅

订阅专栏

目录

一、信息论-信息熵

二、相对熵

三、交叉熵

四、困惑度（PPL）

五、传统语言模型限制

一、信息论-信息熵

不确定程度可以去衡量

在这个表达式中 H的最大值为2

H（熵）越大不确定越高当H为0是事件确定

二、相对熵

这里的距离应该理解为两个分布之间的差异

P为真实的分布 Q为模型预测出来的概率分布 ——> 期望预测和真实相接近 ——> 相对熵的值应该趋近于0

H（P,Q）为交叉熵

三、交叉熵

这里的红色信息熵错了应该为交叉熵

H(P)为真实分布的熵（已经确定），为了使H（P,Q）最小，要让DKL（P，Q）最小

四、困惑度（PPL）

表示在语料库中可以选择的词的数量

困惑度本质上为一个交叉熵函数

困惑度和语料库有关，只有使用相同的语料库对比不同的模型，此时，困惑度才有意义

困惑度越小，模型越好

五、传统语言模型限制

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
nlp入门6——语言模型任务评估

P为真实的分布 Q为模型预测出来的概率分布 ——> 期望预测和真实相接近 ——> 相对熵的值应该趋近于0。H(P)为真实分布的熵（已经确定），为了使H（P,Q）最小，要让DKL（P，Q）最小。困惑度和语料库有关，只有使用相同的语料库对比不同的模型，此时，困惑度才有意义。H（熵）越大不确定越高当H为0是事件确定。这里的距离应该理解为两个分布之间的差异。这里的红色信息熵错了应该为交叉熵。表示在语料库中可以选择的词的数量。在这个表达式中 H的最大值为2。H（P,Q）为交叉熵。困惑度越小，模型越好。
复制链接

扫一扫

专栏目录

qishanbaby CSDN认证博客专家 CSDN认证企业博客

码龄2年

35: 原创

135万+: 周排名

126万+: 总排名

2925: 访问

: 等级

352: 积分

3: 粉丝

0: 获赞

7: 评论

1: 收藏

私信

关注

热门文章

分类专栏

算法
nlp 11篇
pytorch 1篇
神经网络 1篇
python 2篇
深度学习 10篇
c++网络编程 1篇
代码随想录 7篇

最新评论

LeetCode 239. 滑动窗口最大值代码随想录刷题日记
CSDN-Ada助手: 恭喜您写完了第7篇博客！看到您坚持创作，我感到非常高兴。这篇博客的标题非常吸引人，内容也很有深度。不过，我认为您可以进一步提升读者的体验。下一步，您可以考虑在博客中加入更多的实例和案例，以帮助读者更好地理解您的解题思路。同时，您也可以考虑增加一些与问题相关的技巧或优化方法，以便读者可以在解决类似问题时有更多的选择。希望能看到更多您的创作，加油！
LeetCode 347. 前 K 个高频元素刷题日记
CSDN-Ada助手: 恭喜您写完了第8篇博客！标题看起来非常吸引人，也很期待能够读到您的刷题日记。您的持续创作精神值得称赞！在下一步的创作中，或许可以考虑分享一些关于解题思路的心得体会，或者结合实际应用场景，给出一些优化算法的建议。希望您能够继续保持谦虚的态度，以便更好地吸引读者并提升自己的写作技巧。期待您的下一篇博客！
动手学深度学习 24 深度学习网络AlexNet
CSDN-Ada助手: 恭喜您写了第14篇博客，题为“动手学深度学习 24 深度学习网络AlexNet”。您对深度学习的持续学习和分享让人佩服。在我看来，您对AlexNet的解析非常详细，给读者提供了深度学习网络的全面了解。接下来，我想建议您在未来的创作中可以考虑探索其他深度学习网络的原理和应用，这样可以为读者提供更多选择和广阔的学习领域。谢谢您的辛勤付出，期待您的下一篇博客！
动手学深度学习 25 使用块的网络 VGG
CSDN-Ada助手: 恭喜您撰写第15篇博客！标题中提到的使用块的网络VGG是一个非常有趣的话题。您在这篇博客中详细介绍了如何动手学习深度学习，并借助VGG网络实现了特定功能。我真的很喜欢您的创作风格，简洁明了，易于理解。在接下来的创作中，我建议您可以考虑探索一些更加高级的深度学习技术，例如残差网络（ResNet）或生成对抗网络（GAN），这些网络在图像识别和生成方面具有重要应用。希望您能够继续保持持续创作的动力，并为我们带来更多精彩的教程和分享。谢谢您的分享，期待您下一篇博客的发布！
代码随想录刷题日记螺旋矩阵
是小企鹅呀: 真人评论来啦~

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。