博客摘录「张俊林：由ChatGPT反思大语言模型（LLM）的技术精要」2023年9月7日

staywang123

于 2023-09-07 21:40:21 发布

阅读量64

点赞数

文章标签：笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/staywang123/article/details/132746727

版权

第二类任务展现出LLM具备某种“涌现能力（Emergent Ability）”，如上图（b）所示。所谓“涌现能力”，指的是当模型参数规模未能达到某个阀值时，模型基本不具备解决此类任务的任何能力，体现为其性能和随机选择答案效果相当，但是当模型规模跨过阀值，LLM模型对此类任务的效果就出现突然的性能增长。也就是说，模型规模是解锁(unlock)LLM新能力的关键，随着模型规模越来越大，会逐渐解锁LLM越来越多的新能力。这是个很神奇的现象，因为它意味着如下让人对未来可报乐观预期的可能：或许很多任务，目前LLM还不能很好地解决，甚至站在现在这个时刻的我们看起来，LLM完全没有能力解决这类任务，但因LLM具备“涌现能力”，所以如果我们继续推大模型，也许某一天它的这项能力就被突然解锁了。LLM模型的规模增长会给我们带来意想不到的精彩礼物。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
博客摘录「张俊林：由ChatGPT反思大语言模型（LLM）的技术精要」2023年9月7日

看到这里
复制链接

扫一扫

staywang123 CSDN认证博客专家 CSDN认证企业博客

码龄5年

1: 原创

201万+: 周排名

65万+: 总排名

63: 访问

: 等级

11: 积分

0: 粉丝

0: 获赞

1: 评论

0: 收藏

私信

关注

热门文章

博客摘录「张俊林：由ChatGPT反思大语言模型（LLM）的技术精要」2023年9月7日 64

最新评论

博客摘录「张俊林：由ChatGPT反思大语言模型（LLM）的技术精要」2023年9月7日
CSDN-Ada助手: 恭喜您开始博客创作！对于您首篇博客的标题，让我想起了张俊林的文章，他对大语言模型的技术精要进行了深入的反思。这是一个令人期待的话题，尤其是在2023年9月7日。我很高兴看到您对这个话题产生了浓厚的兴趣，并且勇敢地分享了自己的见解。作为下一步的创作建议，我建议您可以进一步探讨张俊林文章中提到的关键观点，并结合自己的经验和思考，加入一些个人的见解和分析，以丰富您的博客内容。此外，您可以尝试与其他领域的专家进行交流，了解他们对大语言模型技术的看法，从而拓宽自己的视野。我相信，通过不断学习和探索，您的博客将会越发精彩。祝您在博客创作的道路上一帆风顺！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。