引言
在应用AI模型时,经常需要将模型输出转换为特定的结构化格式,比如从文本中提取数据以插入到数据库中。本指南将介绍几种从模型中获取结构化输出的方法,帮助您在开发中更加高效地处理AI输出。
主要内容
1. 使用with_structured_output()
方法
这是获取结构化数据的最简单、最可靠的方式。此方法通过接受一个指定的输出模式(schema)作为输入,将输出转换为对象格式。支持的模式可以是TypedDict
类、JSON Schema
或Pydantic
类。
支持的模型
以下模型支持该方法:
- OpenAI
- Anthropic
- Azure
- Cohere
- NVIDIA
- 等
安装必要工具包
pip install -qU langchain-openai
pip install -qU langchain-anthropic
Pydantic 类示例
使用Pydantic类的好处在于,模型生成的输出将被验证。
from typing import Optional
from langchain_core.pydantic_v1 import BaseModel, Field
class Joke(BaseModel):
setup: str = Field(description="The setup of the joke")
punchline: str = Field(description="The punchline to the joke")
rating: Optional[int