大规模语言模型理论基础笔记-大模型的能力

最新推荐文章于 2024-07-28 15:37:27 发布

何草不玄丶

最新推荐文章于 2024-07-28 15:37:27 发布

阅读量55

点赞数

文章标签：语言模型笔记人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_47637467/article/details/134985662

版权

以GPT3 (1750亿参数)为基准，其并没有在多项任务上起到绝对性的优胜地位。

语言模型的适应性（即迁移性），从语言模型到任务模型的转化

主要有以下几种实现方式：（微调和prompts learning）

这里使用了prompts learning进行了GPT3的性能测试，主要评估的任务分为三点，分别是：

任务定义及动机
如何adaption，将任务简化为语言模型
其与任务特定的SOTA模型比起来性能如何

Language modeling

评价指标：困惑度，当预测准确度及确定性较低时，则模型的困惑度会更高。

为了避免序列长度过长带来的联合概率趋向于0导致的无法计算，采用几何平均计算整体的困惑度。

1. 1. Penn Tree Bank 句法解析超过SOTA，但可能存在数据泄露
  2. LAMBADA 预测最后一个词超过GPT2
  3. HellaSwag 填空完成句子，评估模型进行常识推理的能力此类问题的评估一直很难，包括定量和人类定性评估，这里提到了一些启发式方法：

结果：GPT3在没有微调的情况下接近SOTA

Question Answering

1. NaturalQuestions 答案长度较长，在长问答上 GPT3能力低于SOTA
2. WenQuesions 在生成提示后，GPT3能力略低于SOTA RAG
3. TriviaQA 在生成提示后，GPT3模型能力超过RAG

Translation

评估标准是 BLEU，其在德语法语罗马尼亚语到英语的翻译任务上几乎与SOTA持平。

Arithmetic

算术题与语言模型无关，但能体现出模型的学习能力和逻辑推理能力，在175亿参数下简单算术题基本可以答对。

News article generation

给定新闻标题和副标题生成新闻内容的任务，GPT3基本可以做到让人类难以区分的程度

使用新词造句和纠正英语语法

其他任务

何草不玄丶

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
大规模语言模型理论基础笔记-大模型的能力

第二章大模型能力学习笔记
复制链接

扫一扫

何草不玄丶 CSDN认证博客专家 CSDN认证企业博客

码龄4年

32: 原创

108万+: 周排名

19万+: 总排名

1万+: 访问

: 等级

336: 积分

1: 粉丝

4: 获赞

3: 评论

9: 收藏

私信

关注

热门文章

最新评论

学术论文插图绘制学习第二章
CSDN-Ada助手: 恭喜您撰写了第20篇博客！标题“学术论文插图绘制学习第二章”听起来非常有趣和富有挑战性。您的持续创作真是令人敬佩。在这个有关学术论文插图绘制的系列中，您已经分享了很多宝贵的知识和经验。接下来，我想提供一些建议，希望对您的下一步创作有所帮助。也许您可以考虑探讨一些实用技巧，例如如何选择最合适的图表类型来传达不同的信息，或者如何使用图表来提高读者对您的论文的理解度。此外，如果您能够分享一些常见的图表绘制错误以及如何避免它们的方法，那将非常有益。总之，我非常期待您未来的创作，并且对于您对学术论文插图绘制的研究感到钦佩。希望我的建议能够为您的下一步创作提供一些启发。祝您继续取得成功！
学术论文插图绘制学习第一章
CSDN-Ada助手: 恭喜您撰写第19篇博客！标题“学术论文插图绘制学习第一章”听起来非常有趣和有益。我很高兴看到您一直在持续创作，并且选择了如此重要的主题来分享。您的努力和热情对于向读者传达学术论文插图绘制的技巧和知识无疑将会产生积极的影响。在下一步的创作中，我建议您可以考虑深入探讨如何结合实际案例来说明学术论文插图绘制的重要性和技巧。这样的实例可以帮助读者更好地理解并应用您所分享的知识。同时，您也可以尝试与其他领域的专家或学者合作，以便获得更多的观点和见解。总的来说，您的博客已经走在了正确的道路上。继续努力，保持谦虚的态度，我相信您将继续为读者带来更多有价值的内容。期待您未来的创作！
推荐系统实战：新闻推荐系统基本流程
何草不玄丶: 有的，不过也是从https://github.com/datawhalechina/fun-rec这里进行本地化修改的，可以先参考一下
推荐系统实战：新闻推荐系统基本流程
南宫贇: 您好有完整的代码吗

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。