利用LangSmith Chat数据集轻松微调模型

最新推荐文章于 2025-02-18 14:09:31 发布

AI_小站

最新推荐文章于 2025-02-18 14:09:31 发布

阅读量567

点赞数 15

文章标签： python 人工智能开发语言 LangSmith Chat 大模型微调大模型大模型技术

本文链接：https://blog.csdn.net/python1234567_/article/details/142817643

版权

在这篇文章中，我们将探讨如何使用LangSmith Chat数据集来微调AI模型，并将其应用于LangChain应用中。这个过程简单易行，只需三个步骤：创建聊天数据集、加载示例并微调模型。

引言

随着对聊天AI需求的增加，能够通过特定数据集微调模型以提高性能变得尤为重要。本文将指导你如何利用LangSmith的工具进行这项工作，并为你的LangChain应用提供更好的性能。

主要内容

1. 先决条件

在开始之前，确保你已安装langchain >= 0.0.311，并已使用LangSmith API密钥配置你的环境。

%pip install --upgrade --quiet langchain langchain-openai

import os
import uuid

uid = uuid.uuid4().hex[:6]
os.environ["LANGCHAIN_TRACING_V2"] = "true"
os.environ["LANGCHAIN_API_KEY"] = "YOUR API KEY"

2. 选择数据集

首先，我们需要选择并上传一个数据集。以下代码将创建一个数据集并上传相关的聊天数据。

from langsmith.client import Client
import requests

client = Client()
url = "https://raw.githubusercontent.com/langchain-ai/langchain/master/docs/docs/integrations/chat_loaders/example_data/langsmith_chat_dataset.json"
response = requests.get(url)
response.raise_for_status()
data = response.json()

dataset_name = f"Extraction Fine-tuning Dataset {uid}"
ds = client.create_dataset(dataset_name=dataset_name, data_type="chat")

_ = client.create_examples(
    inputs=[e["inputs"] for e in data],
    outputs=[e["outputs"] for e in data],
    dataset_id=ds.id,
)

3. 准备数据

接下来，使用LangSmithDatasetChatLoader加载聊天数据并转换为微调所需格式。

from langchain_community.chat_loaders.langsmith import LangSmithDatasetChatLoader
from langchain_community.adapters.openai import convert_messages_for_finetuning

loader = LangSmithDatasetChatLoader(dataset_name=dataset_name)
chat_sessions = loader.lazy_load()

training_data = convert_messages_for_finetuning(chat_sessions)

4. 微调模型

现在，我们将使用OpenAI库进行模型微调。

import json
import time
from io import BytesIO
import openai

my_file = BytesIO()
for dialog in training_data:
    my_file.write((json.dumps({"messages": dialog}) + "\n").encode("utf-8"))

my_file.seek(0)
training_file = openai.files.create(file=my_file, purpose="fine-tune")

job = openai.fine_tuning.jobs.create(
    training_file=training_file.id,
    model="gpt-3.5-turbo",
)

status = openai.fine_tuning.jobs.retrieve(job.id).status
start_time = time.time()
while status != "succeeded":
    print(f"Status=[{status}]... {time.time() - start_time:.2f}s", end="\r", flush=True)
    time.sleep(5)
    status = openai.fine_tuning.jobs.retrieve(job.id).status

微调完成后，你的模型已准备就绪！