迁移学习中的模型微调（fine-tune）问题_迁移学习的参数微调指可以改变卷积核大小吗-CSDN博客

本文介绍迁移学习，即在数据量不足时，用大数据集预训练卷积网络，再用于新数据集训练。阐述三个主要迁移学习场景，包括固定特征提取层参数、微调卷积网络等。还给出根据新数据集数量和与原始数据集相似度确定微调策略，以及限制预训练模型、用小学习率等实用建议。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Transfer Learning(迁移学习)

模型训练过程中，很少有人会在数据量不够充足的时候从头开始训练整个卷积网络。通常情况下，一般会使用一个大的数据集对卷积网络进行预训练（例如使用数据集ImageNet，它包含120万张图片，共1000个类别）然后将训练的模型作为预训练模型初始化卷积网络，或者将提取特征的卷积层参数固定，然后再进行训练。

三个主要迁移学习场景如下

1）固定特征提取层的卷积参数。使用ImageNet对卷积网络进行预训练，然后修改最后面的全连接层，同时固定特征提取层的卷积参数，进行新数据集的训练。

2）微调卷积网络。可以微调所有卷积层，也可以将头几层卷积层参数固定（防止过拟合），只微调高维部分的卷积。网络机构当中头几层卷积层包含更多的一般特征（日边沿检测和颜色检测），这些特征在许多任务中都非常有用，但是后面的卷积就会变得更加注重类别间的细节。（我的理解是，网络结构从数据输入层开始，头几层卷积层包含的信息更加具有普适性，而越是往后，卷积层学习到的特征就更加注重类别之间的特征）；

3）预训练模型