预训练(pre-training)与微调(fine-tuning)

最新推荐文章于 2024-08-19 09:46:08 发布

柳叶lhy

最新推荐文章于 2024-08-19 09:46:08 发布

阅读量2.3k

点赞数 2

分类专栏：深度学习文章标签：深度学习计算机视觉人工智能神经网络

本文链接：https://blog.csdn.net/lhyhaiyan/article/details/128398563

版权

深度学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

预训练是指在大型数据集上训练模型，得到的模型参数可以作为新任务的基础。微调则是将预训练模型应用于特定数据集，调整参数以适应新任务。在CNN领域，由于避免过拟合和节省资源，通常采用预训练模型进行微调。预训练和微调在图像分类等任务中广泛应用，有效提高了模型的效率和准确性。

摘要由CSDN通过智能技术生成

什么是预训练？

假设你现在需要搭建一个NN完成图像分类的任务。首先，你需要随机初始化参数，接着使用训练数据开始训练网络，不断对网络进行调整直至网络的损失值越来越小。当你觉得训练结果达到一个满意的状态后，就可以将模型的参数保存下来，以便在下次执行类似任务时拿出来可以直接使用，并且能够获得较好的结果。这个过程就是pre-training。

什么是微调？

在某天，你想在一个新的数据集上进行图像分类工作。这个时候，你可以直接调用之前保存下来的模型参数作为该任务的初始化参数，然后在训练过程中，根据训练结果不断调整，使结果达到预期状态。你使用的是一个pre-trained模型
之后，你又接收到一个类似的图像分类的任务。这个时候，你可以直接使用之前保存下来的模型的参数来作为这一任务的初始化参数，然后在训练的过程中，依据结果不断进行一些修改。这时候，你使用的就是一个，而过程就是fine-tuning。