如何在SQL问答中进行查询验证：确保SQL查询的安全性和有效性

本文链接：https://blog.csdn.net/saeagtj/article/details/144412401

# 引言

在SQL问答中，编写有效且安全的SQL查询是最容易出错的环节之一。随着自动化工具的广泛使用，我们需要确保生成的查询没有错误并且符合预期。本指南将介绍如何通过添加“查询验证”步骤以及通过提示工程来减少错误率，从而验证生成的SQL查询。

# 主要内容

## 1. 查询验证步骤

### 1.1 设置环境

首先，确保安装必要的软件包：

```bash
%pip install --upgrade --quiet langchain langchain-community langchain-openai

1.2 使用Chinook数据库

我们将使用SQLite连接Chinook数据库。按照以下步骤创建Chinook.db：

保存文件为Chinook_Sqlite.sql
运行sqlite3 Chinook.db
运行.read Chinook_Sqlite.sql
测试查询：SELECT * FROM Artist LIMIT 10;

确保在我们的目录中有Chinook.db，并通过SQLAlchemy驱动的SQLDatabase类与之接口。

from langchain_community.utilities import SQLDatabase

db = SQLDatabase.from_uri("sqlite:///Chinook.db")
print(db.get_usable_table_names())

2. 使用API生成查询

在生成SQL查询时，最简单的策略是让模型本身检查查询中的常见错误。以下是相关实现：

from langchain_openai import ChatOpenAI
from langchain.chains import create_sql_query_chain
from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import ChatPromptTemplate

# API设置和模型初始化略过，用类似于以下的设置
llm = ChatOpenAI(model="gpt-4o-mini")

chain = create_sql_query_chain(llm, db)

# 验证查询
system = """检查用户的{dialect}查询是否存在常见错误..."""
prompt = ChatPromptTemplate.from_messages(
    [("system", system), ("human", "{query}")]
).partial(dialect=db.dialect)

validation_chain = prompt | llm | StrOutputParser()
full_chain = {"query": chain} | validation_chain

query = full_chain.invoke({
    "question": "What's the average Invoice from an American customer whose Fax is missing since 2003 but before 2010"
})
print(query)

代码示例

以下是一个完整的代码示例，用于生成和验证SQL查询：

query = full_chain.invoke(
    {
        "question": "What's the average Invoice from an American customer whose Fax is missing since 2003 but before 2010"
    }
)
print(query)

db.run(query)  # 执行并获得结果