Self-supervised Learning先把参数从一张白纸训练到初步成型,再从初步成型训练到完全成型。
预训练模型的时候,就是模型参数从一张白纸到初步成型的这个过程,还是用无标签数据集。
等我把模型参数训练个八九不离十,这时候再根据你下游任务 (Downstream Tasks) 的不同去用带标签的数据集把参数训练到完全成型,那这时用的数据集量就不用太多了,因为参数经过了第1阶段就已经训练得差不多了。
第一个阶段不涉及任何下游任务,就是拿着一堆无标签的数据去预训练,没有特定的任务,这个话用官方语言表达叫做:in a task-agnostic way。
第二个阶段涉及下游任务,就是拿着一堆带标签的数据去在下游任务上 Fine-tune,这个话用官方语言表达叫做:in a task-specific way。
https://mp.weixin.qq.com/s?__biz=MzI5MDUyMDIxNA==&mid=2247599938&idx=1&sn=45b61cf5f5b2036fbf3767779369864e&chksm=ec1daabbdb6a23ad3b15b0773a5688bea96a93e4c25af8b8a36dac7b961887d7897b42c82dce#rd