In-context learning上下文学习的探讨

lucky_append

已于 2024-06-16 13:53:18 修改

阅读量132

点赞数 1

文章标签：学习人工智能机器学习

于 2024-04-30 10:11:37 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41728178/article/details/138336970

版权

上下文学习到底学的是什么
- 任务模式的识别：只关注上文的任务本身，对于上文的任务的映射关系正确与否不关心
  
  比如上文中提示了爱因斯坦是中国人，后续提问中依然可以在回答格式，回答内容上正确，比如提问秦始皇是，模型回复中国人。
  
  任务模式的识别能力大概来源于大规模预训练，指令微调过程中所见过的知识的综合总结，也就是对于已经学习到知识的激活。模型的大小对于此能力的影响会呈现随大小变大能力变大，但会很快到达定点。
- 任务标签映射的学习：学习一个新的知识，新的标签映射关系
  
  大模型之前的预训练，指令微调过程中未见过的窄领域数据时，需要同时学习到回答格式和新的标签映射关系也就是新的知识。
  
  任务学习的能力来源于大规模预训练，指令微调过程中所见过的知识，思维链训练带来的推理能力综合得到的。模型的大小对于此能力的影响会随着模型大小不断的变强。

上下文学习是如何工作的
- 基于贝叶斯逻辑的思考：大模型在大量数据的预训练，指令微调处理中学习的各种各样的知识为基础，因为提示上下文的触发激活了相关知识的总结，融合。
  
  比如秦始皇是哪国人这个问题在之前的训练数据中未出现，但是模型见过秦始皇的个人信息介绍，提到秦始皇是秦王朝的创始人这个知识。同时模型见过秦王朝是中国第一个大一统王朝。所以得出秦始皇是中国人这个结论。

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
In-context learning上下文学习的探讨

任务模式的识别能力大概来源于大规模预训练，指令微调过程中所见过的知识的综合总结，也就是对于已经学习到知识的激活。任务学习的能力来源于大规模预训练，指令微调过程中所见过的知识，思维链训练带来的推理能力综合得到的。基于贝叶斯逻辑的思考：大模型在大量数据的预训练，指令微调处理中学习的各种各样的知识为基础，因为提示上下文的触发激活了相关知识的总结，融合。大模型之前的预训练，指令微调过程中未见过的窄领域数据时，需要同时学习到回答格式和新的标签映射关系也就是新的知识。上下文学习到底学的是什么。上下文学习是如何工作的。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。