Kor 开源项目教程-CSDN博客

本文链接：https://blog.csdn.net/gitblog_00699/article/details/141774419

Kor 开源项目教程

项目介绍

Kor 是一个用于从文本中提取结构化数据的工具，它利用大型语言模型（LLMs）来实现这一目标。Kor 允许用户指定提取数据的架构，并提供一些示例，然后生成一个提示，发送给指定的 LLM，并解析输出结果。Kor 与 LangChain 框架集成，提供了自然语言访问现有 API 的能力。

项目快速启动

安装

首先，通过 pip 安装 Kor：

pip install kor

基本使用

以下是一个简单的示例，展示如何使用 Kor 从文本中提取结构化数据：

from langchain.chat_models import ChatOpenAI
from kor import create_extraction_chain, Object, Text

# 初始化 LLM
llm = ChatOpenAI(
    model_name="gpt-3.5-turbo",
    temperature=0,
    max_tokens=2000,
    model_kwargs={
        'frequency_penalty': 0,
        'presence_penalty': 0,
        'top_p': 1.0
    }
)

# 定义提取架构
schema = Object(
    id="player",
    description=(
        "用户正在控制一个音乐播放器来选择歌曲、暂停或开始它们，或播放音乐"
    ),
    attributes=[
        Text(
            id="action",
            description="用户想要执行的操作，例如播放、暂停或停止",
            required=True
        )
    ]
)

# 创建提取链
chain = create_extraction_chain(llm, schema)

# 提取数据
result = chain.invoke("停止音乐现在")
print(result["validated_data"])