- 博客(1)
- 收藏
- 关注
原创 ACL2023:LLM相关论文总结
上下文学习(ICL)通过在推理时简单地演示少量的例子来提高语言模型在各种NLP任务中的表现。人们对ICL能力出现的原因不是很了解,因为模型从来没有在这种演示上进行过专门的训练。与之前探索ICL背后的隐性机制的工作不同,我们通过调查预训练数据来研究ICL。具体来说,我们首先采用一种迭代的、基于梯度的方法来寻找支持ICL的一小部分预训练数据。我们观察到,在这个小的子集上继续进行预训练可以显著提高模型的ICL能力,提高幅度高达18%。
2023-07-17 12:22:25 2276 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人