【LLM大模型论文日更】| LLMs在预训练和微调阶段的性能变化和它们之间的相互关系

OptimaAI

于 2024-08-18 14:05:57 发布

阅读量1k

点赞数 9

分类专栏： LLM论文日更文章标签：人工智能算法机器学习深度学习 nlp 语言模型预训练

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_59084968/article/details/141298533

版权

论文：https://arxiv.org/pdf/2408.06663
代码：未开源
机构：约翰霍普金斯大学
领域：预训练与微调的关系
发表：arXiv

这篇论文详细地分析了大型语言模型（LLMs）在预训练（pre-training）和微调（fine-tuning）阶段的性能变化和它们之间的相互关系。

Abstract

研究目的：探索预训练与微调之间的关系，特别是它们是如何共同影响模型最终性能的。
研究方法：通过在18个数据集上微调多个预训练模型的中间检查点来进行实验分析。
主要发现：
- 持续的预训练能够在微调后以一种不明显的方式提升模型性能。

这句话的意思是，在大型语言模型（LLMs）的预训练阶段，即使模型在预训练过程中对某些任务的性能提升不明显，持续进行预训练仍然可以在后续的微调阶段带来潜在的性能提升。换句话说，预训练阶段的持续训练可能在当下看起来效果不大，但这些训练所获得的知识或能力会在模型针对特定任务进行微调时显现出来，从而提高模型在这些任务上的表现。

具体来说，这种提升可能表现在以下几个方面：

知识深度：预训练阶段让模型接触到更多的语言数据和模式，这可能加深了模型对语言知识的理解，即使这种理解在预训练阶段并未直接转化为性能提升。

潜在能力：模型可能在预

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

OptimaAI 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。