什么是人工智能领域的 SFT - Supervised Finetuning

本文链接：https://blog.csdn.net/i042416/article/details/134169233

在人工智能领域，Supervised Finetuning是重要概念。它基于预训练模型，用有标签数据微调以适应特定任务。先在大型数据集预训练模型学习通用特征，再在特定任务上用有标签数据集训练，如医学图像诊断，可提升新任务性能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在人工智能（AI）领域，Supervised Finetuning 是一个重要的概念。它涉及到在预训练模型的基础上，利用有标签的数据进行微调，以适应特定的任务或领域。这个过程可以被视为在更广泛的知识基础上进行特定任务的训练，从而在新任务上获得更好的性能。

Supervised Finetuning 这个名词可以被分解为两部分：Supervised 和 Finetuning。首先，Supervised 指的是监督学习，是机器学习的一种类型，其中模型是通过一组有标签的训练数据进行训练的。每个训练样本都有一个对应的标签或结果，模型的任务就是学习从输入数据到这些标签的映射。然后，Finetuning 指的是微调，是指在预训练模型的基础上，进行进一步的训练，以适应特定的任务。

让我们更深入地理解一下这个概念。在深度学习中，有一种常见的做法是首先在大型数据集上预训练一个模型，例如在 ImageNet 上预训练一个卷积神经网络（CNN），或者在大型文本语料库上预训练一个 transformer 模型。这样做的目的是让模型学习到一些通用的、高级的特征或模式，例如在图像中识别边缘或颜色块，在文本中理解语法或句子结构等。

然后，我们会取这个预训练模型，用它作为一个初始模型，然后在特定的任务上进行训练。这个任务有可能是图像分类，也可能是文本情感分析，等等。这个阶段就是 Supervised Finetuning，我们使用有标签的数据集进行训练，模型会学习到如何将学到的通用特征应用到特定的任务上。

例如，我们可能会在 ImageNet 上预训练一个 CNN 模型，这个模型会学习到如何识别边缘、颜色块、纹理等基础特征。然后，我们可能会在一个医学图像数据集上对这个模型进行 Supervised Finetuning，这个数据集包含了一些医学图像（例如 X 光片或 MRI 图像），以及这些图像对应的诊断结果（例如是否有肺炎或者脑瘤）。在这个阶段，模型会学习到如何将前面学到的基础特征应用到医学图像诊断这个特定任务上。