大模型NL2SQL学习与实战指南_大预言模型如何操作数据库-CSDN博客

第一章：学习总览与路线规划

学习目标与成果

掌握大模型生成 SQL 并操作数据库的完整技术栈，从基础理论到实战部署，使学习者能够独立构建一个安全、高效的自然语言查询数据库系统。学习成果包括：

理解NL→SQL转换的原理与流程
掌握多种架构模式（LangChain Chain/Agent、LlamaIndex、OpenAI Function Calling）
能设计高效Prompt模板并控制模型输出格式
具备微调模型与语义增强的能力
能集成LLM、数据库、API和前端构建完整系统
掌握安全防护与性能优化策略

阶段划分与进阶路线图

本指南分为五个阶段，形成一个完整的学习闭环：

阶段	核心内容	技术目标	实战成果
阶段1	NL→SQL原理与架构	理解转换流程与架构差异	实现最小可行NL2SQL Demo
阶段2	Prompt设计与模型调用	掌握Prompt模板构建技巧	构建SQL Agent支持多轮交互
阶段3	模型微调与语义增强	理解微调原理与RAG应用	实现基于自定义Schema的RAG查询
阶段4	系统集成与API部署	掌握系统整合与部署方法	构建生产可用的NL2SQL微服务
阶段5	安全性与性能优化	实施安全防护与性能提升	部署具备日志与安全防护的查询接口

学习周期建议

4周完整学习计划：

第1周：阶段1（理论与架构理解）
第2周：阶段2（Prompt设计与模型调用）
第3周：阶段3（模型微调与语义增强）
第4周：阶段4（系统集成）+ 阶段5（安全性与优化）

环境与工具准备

基础环境：

# 安装Python 3.13
sudo apt-get install python3.13 python3.13-pip

# 创建虚拟环境
python3.13 -m venv llama_sql_env
source llama_sql_env/bin/activate

# 安装核心依赖
pip install langchain langchain-openai langchain-experimental fastapi uvicorn
pip install sqlalchemy asyncpg  # 异步数据库驱动
pip install langchain社区工具
pip install sqlparse fastapi_cache redis  # 安全与缓存依赖

数据库准备：

# 下载Chinook数据库
wget https://www.sqlite.org/2023/chinook.db

# 或使用MySQL
sudo apt-get install mysql-server
mysql -u root -p
CREATE DATABASE chinook;
USE chinook;
source chinook.sql;  # 假设已准备SQL文件

API密钥准备：

# 创建环境变量文件
echo "OPENAI_API_KEY=sk-..." > .env

推荐工具与框架：

LangChain：用于构建大模型应用的框架
FastAPI：高性能Web框架
SQLite/MySQL：关系型数据库
Ollama/vLLM：本地大模型推理引擎
Redis：缓存系统
LangSmith：LangChain监控工具

第二章：阶段 1 - 理论与架构理解

阶段目标

理解NL→SQL转换的核心原理与流程
掌握不同架构模式（Chain/Agent/LlamaIndex/OpenAI Function Calling）的区别
能够实现一个最小可行的NL2SQL Demo

核心概念与原理讲解

NL→SQL转换原理：
NL→SQL转换是将自然语言问题转换为结构化SQL查询的过程。其核心包括三个关键步骤：

文本解析：识别问题中的关键词、意图和实体
语义映射：将自然语言表达映射到数据库表结构和操作
SQL生成：根据映射结果生成符合语法的SQL查询语句

架构组成：

模型层：负责自然语言理解与SQL生成
SQL解析层：验证SQL语法和安全性
数据库引擎：执行SQL查询并返回结果

常见架构模式对比：

架构模式	特点	适用场景	优势	局限性
LangChain Chain	固定流程，预定义工具调用顺序	简单查询场景	实现简单，调试方便	灵活性差，难以处理复杂查询
LangChain Agent	LLM动态决策，可调用多个工具	复杂查询，多轮交互	灵活性高，可处理未知任务	实现复杂，需要更多调试
LlamaIndex	基于向量检索的查询生成	文档与数据库结合场景	天然支持向量检索增强	专用性强，生态相对较小
OpenAI Function Calling	结构化输出，JSON格式	需要严格结构化输出的场景	输出格式统一，易于解析	需要额外处理函数调用逻辑

案例代码：实现最小可行 NL2SQL Demo

环境准备：

# .env文件
OPENAI_API_KEY=sk-...

# 安装依赖
pip install langchain langchain-openai langchain-experimental
pip install sqlparse  # SQL解析库

LangChain Chain实现：

from langchain import OpenAI
from langchain.chains import create_sql_query_chain
from langchain_community utilities import SQLDatabase
import os

# 加载环境变量
os.environ["OPENAI_API_KEY"] = os.getenv("OPENAI_API_KEY")

# 创建数据库连接
db = SQLDatabase.from_uri("sqlite:///chinook.db")

# 初始化LLM
llm = OpenAI(model_name="gpt-3.5-turbo", temperature=0)

# 创建SQL查询链
query_chain = create_sql_query_chain(llm, db)

# 测试查询
user_query = "数据库中有多少名员工？"
response = query_chain.invoke({"question": user_query})

print("SQL Query:", response["query"])
print("Result:", db.run(response["query"]))

OpenAI Function Calling实现：

import openai
import json
import os
import sqlite3

# 加载环境变量
os.environ["OPENAI_API_KEY"] = os.getenv("OPENAI_API_KEY")

# 定义数据库连接函数
def execute_sql(query):
    conn = sqlite3.connect("chinook.db")
    cursor = conn.cursor()
    try:
        cursor.execute(query)
        result = cursor.fetchall()
        return {"status": "success", "result": result}
    except Exception as e:
        return {"status": "error", "message": str(e)}
    finally:
        cursor.close()
        conn.close()

# 定义Function Calling的函数描述
functions = [
    {
        "name": "sql_query",
        "description": "执行SQL查询并返回结果",
        "parameters": {
            "type": "object",
            "properties": {
                "query": {
                    "type": "string",
                    "description": "要执行的SQL查询语句"
                }
            },
            "required": ["query"]
        }
    }
]

# 用户查询
user_query = "数据库中有多少名员工？"

# 调用OpenAI API
response = openai ChatCompletion.create(
    model="gpt-3.5-turbo-0613",
    messages=[{"role": "user", "content": user_query}],
    functions=functions,
    function_call="auto"
)

# 解析响应
if response.choices[0].message.function_call:
    function_name = response.choices[0].message.function_call.name
    arguments = json.loads(response.choices[0].message.function_call arguments)
    if function_name == "sql_query":
        result = execute_sql(arguments["query"])
        print("SQL Query:", arguments["query"])
        print("Result:", result)

实践练习与思考题

练习1：修改Chinook数据库，添加一个名为"students"的表，包含id、name、age、gender字段，然后实现查询"年龄最大的学生是谁"的NL2SQL功能。

思考题1：比较LangChain Chain和Agent在处理多表关联查询时的区别，为什么Agent更适合复杂场景？

练习2：尝试使用不同的模型（如gpt-4o-mini、Claude-3 Opus）替换OpenAI模型，观察生成的SQL查询是否有差异。

思考题2：为什么NL→SQL转换需要考虑数据库Schema？如何将Schema信息有效传递给模型？

第三章：阶段 2 - Prompt 设计与模型调用

阶段目标

掌握Prompt分类与作用
学习Prompt模板构建技巧（从简单模板到schema-aware动态提示）
能够让模型仅输出SQL并控制输出格式
实现多表查询、自动修正SQL和自检机制
构建一个基于LangChain/OpenAI API的SQL Agent

核心概念与原理讲解

Prompt分类：

系统提示（System Prompt）：定义模型角色和任务目标
用户提示（User Prompt）：提供具体问题和上下文
示例提示（Example Prompt）：提供few-shot示例
指令提示（Instruction Prompt）：明确输出格式和要求

Prompt模板构建技巧：

结构化输出：使用JSON或特定格式要求模型输出
Schema注入：动态注入数据库表结构信息
示例引导：提供few-shot示例展示期望输出格式
错误处理：要求模型在生成错误SQL时能够自我修正
多轮交互：设计能够支持上下文记忆的Prompt

模型调用方法：

直接调用：通过API直接获取模型输出
工具调用：使用LangChain的Tools或OpenAI的Function Calling
Agent模式：让模型自主决策调用哪些工具
输出解析：使用OutputParser提取模型输出中的SQL

案例代码：基于 LangChain / OpenAI API 实现一个 SQL Agent

LangChain Agent实现：

from langchain import OpenAI
from langchain agents import create agent, AgentType
from langchain community utilities import SQLDatabase
from langchain_core output_parsers import StrOutputParser
from langchain community tools.sql_database.tool import QuerySQLDataBaseTool
from langchain chains import SequentialChain
from langchain_core prompts import ChatPromptTemplate
from langchain_core runnables import RunnablePassthrough, RunnableLambda
import os
import re

# 加载环境变量
os.environ["OPENAI_API_KEY"] = os.getenv("OPENAI_API_KEY")

# 创建数据库连接
db = SQLDatabase.from_uri("sqlite:///chinook.db")

# 定义SQL执行工具
@tool
def execute_sql(query: str) -> str:
    """执行SQL查询并返回结果"""
    try:
        result = db.run(query)
        return json.dumps(result)
    except Exception as e:
        return f"SQL执行失败：{str(e)}"

# 定义SQL生成工具
def generate_sql(question: str) -> str:
    """生成SQL查询语句"""
    # 构建Prompt模板
    prompt_template = ChatPromptTemplate.from_template(
        """你是一个数据库查询专家，根据以下表结构，将自然语言问题转换为正确的SQL查询语句：
        {schema}
        问题：{question}
        请直接输出SQL语句，不要包含其他内容。
        """
    )

    # 初始化LLM
    llm = OpenAI(model_name="gpt-3.5-turbo", temperature=0)

    # 构建链
    chain = prompt_template | llm | StrOutputParser()

    # 调用链
    return chain.invoke({"schema": db.get_table_info(), "question": question})["text"]

# 创建Agent
tools = [generate_sql, execute_sql]

agent = create_agent(
    model=OpenAI(model_name="gpt-3.5-turbo", temperature=0),
    tools=tools,
    agent_type=AgentType zerohot,
    response_format="sql"
)

# 测试查询
user_query = "哪些学生选修了数学课，分数最高的前三名？"
response = agent.invoke({"messages": [HumanMessage(content=user_query)]})

print("SQL Query:", response["structured_response"])
print("Result:", execute_sql(response["structured_response"])["text"])

OpenAI Function Calling实现：

import openai
import json
import os
import re

# 加载环境变量
os.environ["OPENAI_API_KEY"] = os.getenv("OPENAI_API_KEY")

# 定义SQL执行函数
def execute_sql(query):
    conn = None
    try:
        # 连接数据库
        conn = sqlite3.connect("chinook.db")
        cursor = conn.cursor()

        # 执行查询
        cursor.execute(query)
        result = cursor.fetchall()

        # 获取列名
        columns = [column[0] for column in cursor.description]

        # 构建结果字典
        results = []
        for row in result:
            results.append(dict(zip(columns, row)))

        return {"status": "success", "result": results}
    except Exception as e:
        return {"status": "error", "message": str(e)}
    finally:
        if conn:
            conn.close()

# 定义Function Calling的函数描述
functions = [
    {
        "name": "sql_query",
        "description": "执行SQL查询并返回结果",
        "parameters": {
            "type": "object",
            "properties": {
                "query": {
                    "type": "string",
                    "description": "要执行的SQL查询语句"
                }
            },
            "required": ["query"]
        }
    }
]

# 定义处理Function Calling的辅助函数
def handle_function_call(message, functions):
    if "function_call" in message:
        function_name = message["function_call"]["name"]
        arguments = json.loads(message["function_call"]["arguments"])
        if function_name == "sql_query":
            result = execute_sql(arguments["query"])
            return {
                "role": "assistant",
                "content": f"SQL查询结果：{json.dumps(result)}",
                "function_call": {
                    "name": "sql_query",
                    "arguments": json.dumps(result)
                }
            }
    return None

# 定义Agent循环
def agent_loop(user_input):
    messages = [
        {"role": "system", "content": "你是一个数据库查询专家，能够将自然语言问题转换为正确的SQL查询语句并执行。"},
        {"role": "user", "content": user_input}
    ]

    while True:
        # 调用OpenAI API
        response = openai ChatCompletion.create(
            model="gpt-3.5-turbo-0613",
            messages=messages,
            functions=functions,
            function_call="auto"
        )

        # 检查是否需要函数调用
        function_response = handle_function_call(response["choices"][0]["message"], functions)
        if function_response:
            messages.append(function_response)
        else:
            # 没有函数调用，直接返回结果
            return response["choices"][0]["message"]["content"]

# 测试查询
user_input = "哪些学生选修了数学课，分数最高的前三名？"
print(agent_loop(user_input))

实践练习与思考题

练习1：修改Prompt模板，要求模型在生成SQL前先进行自我验证，如果发现可能的错误，返回修正后的SQL。

思考题1：如何通过Prompt设计确保模型生成的SQL语句是安全的，不会包含危险操作？

练习2：实现一个支持多轮交互的Agent，允许用户对第一次查询结果进行进一步筛选或分析。

思考题2：比较LangChain Agent和OpenAI Function Calling在实现NL2SQL时的优缺点？

练习3：设计一个动态Schema提示，当数据库表结构变化时，Agent能够自动适应并生成正确的SQL。

第四章：阶段 3 - 模型微调与语义增强

阶段目标

理解NL2SQL微调数据集类型与构建方式
掌握Fine-tuning与LoRA微调思路
学习RAG在SQL场景下的应用
实现基于自定义数据库schema的RAG查询增强
使用LlamaFactory/HuggingFace进行小规模指令微调

核心概念与原理讲解

NL2SQL微调数据集：

WikiSQL：早期数据集，包含约20,000个简单的SQL查询
Spider：包含复杂多表查询的数据集，适合训练生成复杂SQL的模型
SParC：扩展了Spider，包含更复杂的查询和更丰富的自然语言描述
自定义数据集：根据特定数据库Schema生成的标注数据

微调方法：

Fine-tuning：全参数微调，效果好但计算成本高
LoRA：低秩适应微调，只训练低秩矩阵，计算成本低
P-Tuning：仅微调特定位置的参数
RLHF：通过强化学习和人类反馈优化模型

RAG在SQL场景的应用：

Schema检索：将数据库表结构信息向量化，检索相关Schema
查询增强：在生成SQL前检索历史成功查询作为参考
结果验证：检索类似查询的结果来验证当前查询的合理性

案例代码：基于自定义数据库 schema 的 RAG 查询增强

RAG查询增强实现：

from langchain chains import create_sql_query_chain
from langchain_openai import ChatOpenAI
from langchain community utilities import SQLDatabase
from langchain community vectorstores import FAISS
from langchain embeddings import HuggingFaceEmbeddings
from langchain_core prompts import ChatPromptTemplate
from langchain_core runnables import RunnablePassthrough
import os
import re
import json

# 加载环境变量
os.environ["OPENAI_API_KEY"] = os.getenv("OPENAI_API_KEY")

# 创建数据库连接
db = SQLDatabase.from_uri("sqlite:///chinook.db")

# 初始化LLM
llm = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0)

# 创建SQL查询链
query_chain = create_sql_query_chain(llm, db)

# 定义Schema信息
schema_info = db.get_table_info()

# 创建向量数据库
embeddings = HuggingFaceEmbeddings(model_name="all-MiniLM-L6-v2")
vector_db = FAISS.from_texts([schema_info], embeddings)

# 创建检索器
retriever = vector_db.as_retriever()

# 定义RAG提示模板
rag_prompt = ChatPromptTemplate.from_template(
    """你是一个数据库查询专家，根据以下表结构和检索到的相关信息，将自然语言问题转换为正确的SQL查询语句：
    {schema}
    检索到的信息：
    {retrieved_info}
    问题：{question}
    请直接输出SQL语句，不要包含其他内容。
    """
)

# 创建RAG链
rag_chain = (
    RunnablePassthrough.assign(retrieved_info=lambda vars: retriever.get_relevantDocuments(vars["question"]))
    | rag_prompt
    | llm
    | StrOutputParser()
)

# 测试查询
user_query = "哪些学生选修了数学课，分数最高的前三名？"
response = rag_chain.invoke({"question": user_query})

print("SQL Query:", response["text"])
print("Result:", db.run(response["text"]))

LoRA微调实现（需安装HuggingFace库）：

from transformers import AutoModelForCausalLM, AutoTokenizer
from peft import LoraConfig, get_peft_model, prepare_model_for_int8_training
from langchain chains import create_sql_query_chain
from langchain community utilities import SQLDatabase
import os
import re
import json

# 加载环境变量
os.environ["OPENAI_API_KEY"] = os.getenv("OPENAI_API_KEY")

# 创建数据库连接
db = SQLDatabase.from_uri("sqlite:///chinook.db")

# 定义微调数据集
# 示例数据，应替换为实际标注数据
train_data = [
    {
        "question": "数据库中有多少名员工？",
        "sql": "SELECT COUNT(*) FROM Employee;"
    },
    {
        "question": "哪些学生选修了数学课，分数最高的前三名？",
        "sql": "SELECT Student.name,Enrollment.score FROM Student JOIN Enrollment ON Student.id = Enrollment student_id WHERE Enrollment.course_name = '数学' ORDER BY Enrollment.score DESC LIMIT 3;"
    }
]

# 准备微调数据
# 将数据转换为HuggingFace格式
train_texts = []
for data in train_data:
    train_texts.append(f"问题：{data['question']} SQL：{data['sql']}")

# 加载模型和分词器
model_name = "Qwen/Qwen3-0.6B"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name, load_in_8bit=True)

# 配置LoRA
lora_config = LoraConfig(
    r=8,
    lora_alpha=16,
    target_modules=["query", "value"],
    lora滴答=0.01,
    bias="none",
    task_type="CAUSAL_LM"
)

# 加载LoRA模型
model = get_peft_model(model, lora_config)
model = prepare_model_for_int8_training(model)

# 定义训练参数
training_args = TrainingArguments(
    output_dir="./lora_sql_model",
    per_device_train_batch_size=4,
    gradient_accumulation_steps=4,
    warmup_steps=100,
    max_steps=1000,
    learning_rate=1e-4,
    logging_dir="./logs",
    logging_steps=10,
    evaluation_strategy="steps",
    eval_steps=100,
    save_strategy="steps",
    save_steps=100,
    report_to="none"
)

# 训练模型
trainer = Trainer(
    model=model,
    args=training_args,
    train_dataset=tokenized_train_texts
)

trainer.train()

# 保存微调模型
model.save_pretrained("./lora_sql_model")
tokenizer.save_pretrained("./lora_sql_model")

实践练习与思考题

练习1：使用WikiSQL或Spider数据集构建自己的NL2SQL微调数据集，并进行小规模微调。

思考题1：LoRA微调与全参数微调相比，有哪些优缺点？如何选择适合的微调方法？

练习2：实现一个RAG系统，将数据库表结构和历史查询结果向量化存储，并在生成SQL时检索相关信息。

思考题2：如何评估微调后的模型在NL2SQL任务上的性能？有哪些常用指标？

练习3：尝试使用不同的微调方法（如P-Tuning、RLHF）对同一数据集进行微调，并比较结果。

第五章：阶段 4 - 系统集成与 API 部署

阶段目标

掌握LLM、数据库、FastAPI和前端的整合方法
理解LangChain Agent与SQLDatabaseToolkit的整合方式
对比vLLM、Ollama和OpenAI三种推理部署方式
构建一个生产可用的NL2SQL微服务
实现完整的前后端交互界面

核心概念与原理讲解

系统集成架构：

前端层：用户界面，接收自然语言查询
API层：FastAPI服务，处理请求并调用Agent
Agent层：LangChain Agent，负责生成和执行SQL
数据库层：SQLite/MySQL数据库，存储和检索数据
监控层：LangSmith/Prometheus，监控系统性能

推理部署对比：

部署方式	适用场景	优势	局限性	资源需求
vLLM	高吞吐量推理	支持并行推理，吞吐量高	配置复杂，需要GPU	GPU资源，高内存
Ollama	本地轻量级推理	配置简单，启动快	性能有限，适合小型应用	CPU资源，中等内存
OpenAI API	无需本地部署	维护简单，全球可用	成本高，延迟可能较大	无需本地资源

生产环境优化：

数据库连接池：避免频繁创建和销毁数据库连接
异步执行：提高系统吞吐量和响应速度
API限流：防止滥用和资源耗尽
日志记录：便于问题追踪和性能分析

案例代码：构建一个完整的 “自然语言查询数据库” Web 服务

FastAPI服务端实现：

from fastapi import FastAPI, HTTPException
from fastapi_cache import Cache
from fastapi_cache.backends import RedisCache
from langchain agents import create agent, AgentType
from langchain community utilities import SQLDatabase
from langchain community tools.sql_database.tool import QuerySQLDataBaseTool
from langchain chains import SequentialChain
from langchain_core prompts import ChatPromptTemplate
from langchain_core runnables import RunnablePassthrough, RunnableLambda
import uvicorn
import os
import re
import json
from sqlalchemy import create_engine, MetaData, Table
from sqlalchemy.ext.asyncio import create_async_engine, AsyncSession
from sqlalchemy.orm import sessionmaker
from fastapi_cache.coder import JsonCoder
from fastapi_cache import FastAPICache
from fastapi_cache.backends import RedisCache
from fastapi_cache依赖项 import get_cache

# 加载环境变量
os.environ["OPENAI_API_KEY"] = os.getenv("OPENAI_API_KEY")

# 创建数据库连接
# 同步引擎用于LangChain
sync_engine = create_engine("sqlite:///chinook.db")
# 异步引擎用于FastAPI
async_engine = create_async_engine("sqlite:///chinook.db", echo=True)

# 创建异步会话
AsyncSessionLocal = sessionmaker(
    async_engine, class_=AsyncSession, expire_on_commit=False
)

# 初始化FastAPI应用
app = FastAPI()

# 配置缓存
@app.on_event("startup")
async def startup():
    # 创建缓存
    FastAPICache.init(
        RedisCache(),
        prefix="sql_cache",
       coder=JsonCoder(),
        app=app
    )

# 定义SQL执行工具
@tool
async def execute_sql(query: str) -> str:
    """执行SQL查询并返回结果"""
    async with AsyncSessionLocal() as session:
        try:
            # 执行查询
            result = await session.execute(query)
            rows = result.fetchall()

            # 构建结果字典
            results = []
            for row in rows:
                results.append(dict(zip([col.name for col in result.keys()], row)))

            return json.dumps(results)
        except Exception as e:
            return f"SQL执行失败：{str(e)}"

# 定义SQL生成工具
def generate_sql(question: str) -> str:
    """生成SQL查询语句"""
    # 构建Prompt模板
    prompt_template = ChatPromptTemplate.from_template(
        """你是一个数据库查询专家，根据以下表结构，将自然语言问题转换为正确的SQL查询语句：
        {schema}
        问题：{question}
        请直接输出SQL语句，不要包含其他内容。
        """
    )

    # 初始化LLM
    llm = OpenAI(model_name="gpt-3.5-turbo", temperature=0)

    # 构建链
    chain = prompt_template | llm | StrOutputParser()

    # 调用链
    response = chain.invoke({"schema": sync_engine.execute("SELECT sql FROM sqlite Master WHERE type='table'").fetchall(), "question": question})

    # 提取SQL
    sql = re.sub(r"‍`&", "", response["text"]).strip()

    return sql

# 创建Agent
tools = [generate_sql, execute_sql]

agent = create_agent(
    model=OpenAI(model_name="gpt-3.5-turbo", temperature=0),
    tools=tools,
    agent_type=AgentType zerohot,
    response_format="sql"
)

# 定义API路由
@app.post("/query")
@Cache()
async def query_database(question: str):
    try:
        # 调用Agent
        response = agent.invoke({"messages": [HumanMessage(content=question)]})

        # 获取SQL
        sql = response["structured_response"]

        # 执行SQL
        result = await execute_sql(sql)

        # 返回结果
        return {"sql": sql, "result": json.loads(result)}
    except Exception as e:
        raise HTTPException(status_code=500, detail=f"查询失败：{str(e)}")

# 运行应用
if __name__ == "__main__":
    uvicorn.run(app, host="0.0.0.0", port=8000)

前端界面实现（使用HTML/CSS/JavaScript）：

<!DOCTYPE html>
<html>
<head>
    <title>NL2SQL查询系统</title>
    <style>
        body {
            font-family: Arial, sans-serif;
            max-width: 800px;
            margin: 0 auto;
            padding: 20px;
        }

        .query-container {
            margin-bottom: 20px;
        }

        #query-input {
            width: 100%;
            padding: 10px;
            font-size: 16px;
            border: 1px solid #ddd;
            border-radius: 4px;
            box-sizing: border-box;
        }

        #query-button {
            background-color: #4CAF50;
            color: white;
            padding: 10px 20px;
            border: none;
            border-radius: 4px;
            cursor: pointer;
        }

        #result-container {
            margin-top: 20px;
            padding: 20px;
            background-color: #f9f9f9;
            border-radius: 4px;
        }

        #sql-query {
            font-family: monospace;
            margin-bottom: 10px;
        }

        #queryresult {
            font-family: monospace;
        }
    </style>
</head>
<body>
    <h1>NL2SQL查询系统</h1>
    <div class="query-container">
        <input type="text" id="query-input" placeholder="请输入自然语言查询">
        <button id="query-button">执行查询</button>
    </div>
    <div id="result-container" style="display: none;">
        <h2>查询结果</h2>
        <pre id="sql-query"></pre>
        <pre id="queryresult"></pre>
    </div>

    <script>
        // 获取元素
        const queryInput = document.getElementById('query-input');
        const queryButton = document.getElementById('query-button');
        const resultContainer = document.getElementById('result-container');
        const sqlQuery = document.getElementById('sql-query');
        const queryResult = document.getElementById('queryresult');

        // 执行查询
        async function executeQuery() {
            // 获取查询内容
            const question = queryInput.value;

            // 显示等待状态
            queryButton.disabled = true;
            queryButton.textContent = "正在查询...";

            // 发送请求
            try {
                const response = await fetch('http://localhost:8000/query', {
                    method: 'POST',
                    headers: {
                        'Content-Type': 'application/json',
                    },
                    body: JSON.stringify({ question: question }),
                });

                // 解析响应
                const data = await response.json();
                resultContainer.style.display = 'block';

                // 显示SQL查询
                sqlQuery.textContent = 'SQL查询：\n' + data.sql;

                // 显示查询结果
                queryResult.textContent = '查询结果：\n' + JSON.stringify(data.result, null, 2);
            } catch (error) {
                alert('查询失败：' + error.message);
            } finally {
                queryButton.disabled = false;
                queryButton.textContent = "执行查询";
            }
        }

        // 绑定事件
        queryButton.addEventListener('click', executeQuery);
        queryInput.addEventListener('keypress', function(e) {
            if (e.key === 'Enter') {
                executeQuery();
            }
        });
    </script>
</body>
</html>

实践练习与思考题

练习1：修改FastAPI服务，添加数据库连接池配置，提高并发性能。

思考题1：如何评估不同推理部署方式（vLLM/Ollama/OpenAI）的性能和成本？在什么情况下选择哪种方式？

练习2：实现API限流功能，防止滥用和资源耗尽。

思考题2：如何处理数据库连接池满载的情况？有哪些常见解决方案？

练习3：添加前端界面的错误处理，当查询失败时显示友好的错误信息。

第六章：阶段 5 - 安全性与性能优化

阶段目标

实现防SQL注入Prompt设计
构建SQL执行前的验证与黑名单过滤机制
实施缓存策略（SQL缓存、语义缓存）
优化并发与异步执行（AsyncIO + 数据库连接池）
添加模型调用性能监控与日志追踪

核心概念与原理讲解

安全策略：

防SQL注入Prompt：在Prompt中明确要求模型生成安全的SQL查询
SQL验证：解析SQL语法，检查是否包含危险操作
黑名单过滤：拦截已知危险操作和关键字
权限控制：限制数据库访问权限，只允许查询操作

性能优化：

缓存策略：
- SQL缓存：缓存常用SQL查询结果
- 语义缓存：缓存相似自然语言查询对应的SQL
并发优化：
- 数据库连接池：重用数据库连接，减少开销
- 异步执行：非阻塞处理查询，提高吞吐量
模型调用优化：
- 批处理：合并多个查询请求，提高利用率
- 缓存模型响应：缓存模型输出的SQL，减少重复调用

案例代码：构建一个具备日志与安全防护机制的查询接口

安全防护与性能优化实现：

from fastapi import FastAPI, HTTPException
from fastapi_cache import Cache
from fastapi_cache.backends import RedisCache
from langchain agents import create_agent, AgentType
from langchain community utilities import SQLDatabase
from langchain community tools.sql_database.tool import QuerySQLDataBaseTool
from langchain chains import SequentialChain
from langchain_core prompts import ChatPromptTemplate
from langchain_core runnables import RunnablePassthrough, RunnableLambda
import uvicorn
import os
import re
import json
from sqlalchemy import create_engine, MetaData, Table
from sqlalchemy.ext.asyncio import create_async_engine, AsyncSession
from sqlalchemy.orm import sessionmaker
from fastapi_cache.coder import JsonCoder
from fastapi_cache import FastAPICache
from fastapi_cache依赖项 import get_cache
import langsmith
from langsmith import LangSmith
import time
import redis
from redis import Redis
import sqlparse
from sqlparse tokens import Token

# 加载环境变量
os.environ["OPENAI_API_KEY"] = os.getenv("OPENAI_API_KEY")
os.environ["LANGSMITH_API_KEY"] = os.getenv("LANGSMITH_API_KEY")

# 初始化LangSmith监控
client = LangSmith()
run_id = client.start_run()

# 创建数据库连接
# 同步引擎用于LangChain
sync_engine = create_engine("sqlite:///chinook.db", pool_size=5, max_overflow=10)
# 异步引擎用于FastAPI
async_engine = create_async_engine("sqlite:///chinook.db", echo=True)

# 创建异步会话
AsyncSessionLocal = sessionmaker(
    async_engine, class_=AsyncSession, expire_on_commit=False
)

# 创建Redis客户端
redis_client = Redis(host='localhost', port=6379, db=0)

# 定义安全检查函数
def safe_sql_check(query):
    # 使用sqlparse解析SQL
    parsed = sqlparse.parse(query)
    if not parsed:
        return False, "无法解析SQL语句"

    # 检查是否包含危险操作
   危险操作 = ['DROP', 'TRUNCATE', 'DELETE', 'ALTER', 'CREATE', 'GRANT', 'REVOKE']
    for token in parsed[0].tokens:
        if token.ttype == Token.Name and token.value.upper() in 危险操作:
            return False, f"禁止使用{token.value}操作"

    # 检查是否包含危险关键字
    危险关键字 = ["'", '"', ';', 'UNION', 'LIKE', 'WHERE']
    for关键字 in 危险关键字:
        if 关键字 in query:
            return False, f"查询中包含危险关键字：{关键字}"

    # 检查是否包含JOIN多表查询（可选限制）
    if "JOIN" in query:
        return False, "暂不支持多表JOIN查询"

    return True, "SQL安全检查通过"

# 定义缓存函数
def get_cache_key(question):
    # 使用哈希算法生成缓存键
    import hashlib
    return f"sql_cache:{hashlib.sha256(question.encode()).hexdigest()}"

# 定义异步执行函数
async def asyncExecuteSQL(query):
    try:
        # 检查SQL安全性
        is_safe, message = safe_sql_check(query)
        if not is_safe:
            return {"status": "error", "message": message}

        # 获取异步会话
        async with AsyncSessionLocal() as session:
            # 执行查询
            result = await session.execute(query)
            rows = result.fetchall()

            # 构建结果字典
            results = []
            for row in rows:
                results.append(dict(zip([col.name for col in result.keys()], row)))

            return {"status": "success", "result": results}
    except Exception as e:
        return {"status": "error", "message": str(e)}

# 定义缓存装饰器
def cache装饰器 questions, maxsize=100, typed=False):
    def装饰器 (func):
        缓存 = {}
        def wrapper(*args, **kwargs):
            question = args[0] if args else kwargs.get('question')
            if question in 缓存:
                return 缓存[question]
            result = func(*args, **kwargs)
            缓存[question] = result
            return result
        return wrapper
    return 装饰器

# 定义日志记录函数
def logExecutionTime(func):
    async def wrapper(*args, **kwargs):
        start_time = time.time()
        result = await func(*args, **kwargs)
        end_time = time.time()
        print(f"{func.__name__} 执行时间：{end_time - start_time}秒")
        return result
    return wrapper

# 定义API限流中间件
class RateLimiter:
    def __init__(self, max_requests=100, interval=60):
        self.max_requests = max_requests
        self.interval = interval
        self.request_count = {}
        self.last_request_time = {}

    async def __call__(self, request):
        client_ip = request.client.host
        current_time = time.time()

        # 更新请求计数
        if client_ip not in self.request_count:
            self.request_count[client_ip] = 1
            self.last_request_time[client_ip] = current_time
        else:
            # 如果超过间隔时间，重置计数
            if current_time - self.last_request_time[client_ip] > self interval:
                self.request_count[client_ip] = 1
                self.last_request_time[client_ip] = current_time
            else:
                self.request_count[client_ip] += 1

                # 如果超过最大请求数，拒绝请求
                if self.request_count[client_ip] > self.max_requests:
                    return HTTPException(
                        status_code=429,
                        detail=f"请求过多，请在{self interval}秒后重试"
                    )

        # 继续处理请求
        return await request.app.reverse Router(request)

# 初始化FastAPI应用
app = FastAPI()

# 添加限流中间件
limiter = RateLimiter()
app.add_middleware(limiter)

# 配置缓存
@app.on_event("startup")
async def startup():
    # 创建缓存
    FastAPICache.init(
        RedisCache(),
        prefix="sql_cache",
       coder=JsonCoder(),
        app=app
    )

# 定义SQL执行工具
@tool
async def execute_sql(query: str) -> str:
    """执行SQL查询并返回结果"""
    result = await asyncExecuteSQL(query)
    return json.dumps(result)

# 定义SQL生成工具
def generate_sql(question: str) -> str:
    """生成SQL查询语句"""
    # 构建Prompt模板
    prompt_template = ChatPromptTemplate.from_template(
        """你是一个数据库查询专家，根据以下表结构，将自然语言问题转换为正确的SQL查询语句：
        {schema}
        问题：{question}
        请直接输出SQL语句，不要包含其他内容。
        """
    )

    # 初始化LLM
    llm = OpenAI(model_name="gpt-3.5-turbo", temperature=0)

    # 构建链
    chain = prompt_template | llm | StrOutputParser()

    # 调用链
    response = chain.invoke({"schema": sync_engine.execute("SELECT sql FROM sqlite Master WHERE type='table'").fetchall(), "question": question})

    # 提取SQL
    sql = re.sub(r"‍`&", "", response["text"]).strip()

    return sql

# 创建Agent
tools = [generate_sql, execute_sql]

agent = create_agent(
    model=OpenAI(model_name="gpt-3.5-turbo", temperature=0),
    tools=tools,
    agent_type=AgentType zerohot,
    response_format="sql"
)

# 定义API路由
@app.post("/query")
@Cache()
async def query_database(question: str):
    try:
        # 记录开始时间
        start_time = time.time()

        # 调用Agent
        response = agent.invoke({"messages": [HumanMessage(content=question)]})

        # 获取SQL
        sql = response["structured_response"]

        # 执行SQL
        result = await execute_sql(sql)

        # 记录结束时间
        end_time = time.time()

        # 记录到LangSmith
        client.log_run(
            run_id=run_id,
            messages=[HumanMessage(content=question), AIMessage(content肋骨)]
        )

        # 返回结果
        return {
            "sql": sql,
            "result": json.loads(result),
            "execution_time": end_time - start_time,
            "cache_status": "hit" if redis_client.exists(get_cache_key(question)) else "miss"
        }
    except Exception as e:
        raise HTTPException(status_code=500, detail=f"查询失败：{str(e)}")

# 运行应用
if __name__ == "__main__":
    uvicorn.run(app, host="0.0.0.0", port=8000)

实践练习与思考题

练习1：实现一个更完善的SQL安全检查函数，支持检测更多危险操作和关键字。

思考题1：如何平衡SQL安全检查的严格性和查询灵活性？有哪些常见折衷方案？

练习2：实现语义缓存，对相似的自然语言查询返回相同的SQL结果。

思考题2：如何评估缓存策略的效果？有哪些常用指标？

练习3：添加数据库连接池监控，当连接池满载时自动扩展或提示用户。

思考题3：如何处理高并发场景下的异步数据库查询？有哪些常见优化方法？

第七章：附录与扩展内容

工具/框架	适用场景	优势	局限性	学习难度
LangChain	复杂查询，多轮交互	生态丰富，灵活性高	配置复杂，学习曲线陡峭	中等
LlamaIndex	向量检索增强查询	天然支持向量检索，适合文档与数据库结合	生态相对较小，功能较新	中等
OpenAI Function Calling	结构化输出，简单查询	输出格式统一，易于解析	需要额外处理函数调用逻辑	低
vLLM	高吞吐量推理	支持并行推理，吞吐量高	配置复杂，需要GPU	高
Ollama	本地轻量级推理	配置简单，启动快	性能有限，适合小型应用	低
Redis	SQL缓存	高性能，支持多种缓存策略	需要额外部署和维护	中等