自然语言转SQL，一个微调ChatGPT3.5的实例(下)--模型微调及模型性能

最新推荐文章于 2025-03-04 21:24:44 发布

数大招疯

最新推荐文章于 2025-03-04 21:24:44 发布

阅读量1.8k

点赞数 27

文章标签：人工智能深度学习

本文链接：https://blog.csdn.net/rkjava/article/details/135397367

版权

本文介绍了如何使用GPT-3.5-turbo进行Spider数据集的微调，对比了微调后的模型与DIN-SQL+GPT-4的性能，发现微调在保持准确性的同时大幅降低成本和提升速度。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

提交训练集进行微调

一旦我们创建了JSONL文件（可以在这里或ipfs_here找到一个小样本），下一步是使用以下命令将创建的文件上传到OpenAI：

openai.api_key = os.getenv("OPENAI_API_KEY")
print(openai.File.create(file=open("spider-finetuning.jsonl", "rb"),purpose='fine-tune'))

上传文件后，可以使用以下命令检查上传的状态：


print(openai.File.retrieve(id="file-id"))
# 或者
print(openai.File.list())

结果应该类似于：

{
"object": "file",
"id": "file-id",
"purpose": "fine-tune",
"filename": "file",
"bytes": 71699079,
"created_at": 1693343752,
"status": "uploaded",
"status_details": null
}

当状态变为已处理时（类似于下面的示例），您可以将文件用于微调：

{
"object": "file",
"id": "file-id",
"purpose": "fine-tune",
"filename": "file",
"bytes": 71699079,
"created_at": 1693343752,
"status": "processed",
"status_details": null
}

现在，我们准备开始微调作业。可以使用以下python代码创建一个微调作业：


print(openai.FineTuningJob.create(
training_file="file-id",
model="gpt-3.5-turbo",
suffix = "spider",
hyperparameters = {
"n_epochs": #number_of_epochs,
})
)

微调过程的持续时间将根据微调数据集的大小而有所不同。微调有一个最大令牌限制，设置为50000000个令牌。因此，在使用Spider数据集时，我们将样本数量从7000个减少到5750个，并进行总共2个时期的微调。

您可以使用以下命令检查微调作业的状态：

print(openai.FineTuningJob.retrieve(id="ftjob-id"))

结果应类似于：

{
"object": "fine_tuning.job",
"id": "ftjob-id",
"model": "gpt-3.5-turbo-0613",
"created_at": 1693346245,
"finished_at": 1693353313,
"fine_tuned_model": "ft:gpt-3.5-turbo-0613:dataherald:spider:id",
"organization_id": "org-id",
"result_files": [
"file-id"
],
"status": "succeeded",
"validation_file": null,
"training_file": "file-id",
"hyperparameters": {
"n_epochs": 2
},
"trained_tokens": 44722020
}

模型性能

DIN-SQL是一种用于自然语言到SQL转换的模型，它在处理Spider数据集上取得了最新的研究成果。DIN-SQL代表"Denoising-inductive SQL generation"，该模型结合了去噪自编码器和归纳式学习的方法，使用GPT-4作为生成器模型来生成SQL查询语句。DIN-SQL使用了各种高级提示技术，包括少量示例提示、思路链提示和分解提示，以提高其性能和准确度。该模型具有较高的准确性和效率，但在成本和处理时间方面可能较高。

我们将微调模型的性能与未经微调的GPT3.5-Turbo和DIN-SQL + GPT-4（Spider的当前最先进方法）进行了基准测试，以获得零-shot性能。