NeurIPS 2022|DeepMind最新研究:大模型背后的ICL可能与数据分布密切相关 大模型 自然语言处理 机器学习 传统的文本语言模型倾向于两阶段的训练模式,即首先在大规模语料库上进行预训练,然后在目标下游任务上进行微调,这种方式会受数据标注质量和过拟合