论文浅尝 | 大语言模型在in-context learning中的不同表现

最新推荐文章于 2024-06-25 21:00:03 发布

开放知识图谱

最新推荐文章于 2024-06-25 21:00:03 发布

阅读量537

点赞数

文章标签：语言模型人工智能知识图谱机器学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/TgqDT3gGaMdkHasLZv/article/details/130097540

版权

谷歌等机构的最新论文探讨了大语言模型如何处理上下文学习，尤其是在语义先验和输入-标签映射方面。研究发现，大型模型能覆盖语义先验，而小型模型更依赖于先验。指令学习可以增强这种映射能力，但也强化了语义先验。

摘要由CSDN通过智能技术生成

笔记整理：毕祯，浙江大学博士，研究方向为知识图谱、自然语言处理

链接：https://arxiv.org/pdf/2303.03846.pd

本文是谷歌等机构最新发表的论文，旨在研究大模型上下文学习的能力。这篇论文研究了语言模型中的上下文学习是如何受到语义先验和输入-标签映射的影响。作者研究了两种不同的设置，并在各种模型（包括GPT-3， InstructGPT，Codex，PaLM和Flan-PaLM）上进行了实验。实验发现，对于小型语言模型来说，语义先验对于ICL的影响更大，而对于大型语言模型来说，即使有更强的语义先验，也可以通过反转标签或学习无关联标签的方式进行学习任务。此外，作者还发现通过指令学习可以增强语义先验和输入-标签映射的能力。

总体介绍

图1

本文展示了三种不同的上下文学习方式：常规上下文学习、反转标签的上下文学习以及不相关标签的

最低0.47元/天解锁文章

开放知识图谱

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
论文浅尝 | 大语言模型在in-context learning中的不同表现

笔记整理：毕祯，浙江大学博士，研究方向为知识图谱、自然语言处理链接：https://arxiv.org/pdf/2303.03846.pd本文是谷歌等机构最新发表的论文，旨在研究大模型上下文学习的能力。这篇论文研究了语言模型中的上下文学习是如何受到语义先验和输入-标签映射的影响。作者研究了两种不同的设置，并在各种模型（包括GPT-3，InstructGPT，Codex，PaLM和Flan-PaL...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。