【Pandas】pandas.read_sql_query 详解与实战应用：读取 SQL 查询结果

最新推荐文章于 2025-03-01 07:30:00 发布

I'mAlex

最新推荐文章于 2025-03-01 07:30:00 发布

阅读量1.4k

点赞数 27

文章标签： pandas sql 数据库

本文链接：https://blog.csdn.net/g310773517/article/details/140891523

版权

pandas 专栏收录该内容

85 篇文章

订阅专栏

在数据科学和分析过程中，经常需要从数据库中提取特定的数据进行处理和分析。Pandas 提供了 read_sql_query 函数，从 SQL 数据库中执行查询并将结果转换为 Pandas DataFrame。这篇博客将详细讲解 read_sql_query 方法，包括其作用、使用方法、参数详解、示例代码以及注意事项。

🧑 博主简介：现任阿里巴巴嵌入式技术专家，15年工作经验，深耕嵌入式+人工智能领域，精通嵌入式领域开发、技术管理、简历招聘面试。CSDN优质创作者，提供产品测评、学习辅导、简历面试辅导、毕设辅导、项目开发、C/C++/Java/Python/Linux/AI等方面的服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：gylzbk）

💬 博主粉丝群介绍：① 群内初中生、高中生、本科生、研究生、博士生遍布，可互相学习，交流困惑。② 热榜top10的常客也在群里，也有数不清的万粉大佬，可以交流写作技巧，上榜经验，涨粉秘籍。③ 群内也有职场精英，大厂大佬，可交流技术、面试、找工作的经验。④ 进群免费赠送写作秘籍一份，助你由写作小白晋升为创作大佬。⑤ 进群赠送CSDN评论防封脚本，送真活跃粉丝，助你提升文章热度。有兴趣的加文末联系方式，备注自己的CSDN昵称，拉你进群，互相学习共同进步。

在这里插入图片描述

【Pandas】pandas.read_sql_query 详解与实战应用：读取 SQL 查询结果

1.简介 📘
2.什么是 `read_sql_query` 📋
3.为什么使用 `read_sql_query` 🤔
4. `read_sql_query` 方法详解 🔍
6.参考资料 📚
7.结论 🏁

1.简介 📘

2.什么是 `read_sql_query` 📋

read_sql_query 是 Pandas 提供的一个函数，用于执行 SQL 查询并将结果转换为 Pandas DataFrame。这种方法使得在 Python 中处理 SQL 查询结果变得更加方便和高效。

3.为什么使用 `read_sql_query` 🤔

使用 read_sql_query 方法有以下几个优点：

灵活性：能够执行任意的 SQL 查询，并获取查询结果。
便捷性：直接将查询结果转换为 Pandas DataFrame，便于后续的数据分析和处理。
易用性：提供简洁的接口，通过简单几行代码即可实现执行和读取 SQL 查询结果的功能。

4. `read_sql_query` 方法详解 🔍

4.1 方法签名 🖊️

pandas.read_sql_query(sql, con, index_col=None, coerce_float=True, params=None, parse_dates=None, chunksize=None)

4.2 参数解释 📝

sql: 类型：str。说明：包含 SQL 查询的字符串。
con: 类型：SQLAlchemy connectable、str、sqlite3 connection。说明：数据库连接对象或数据库 URL。
index_col: 类型：str 或者 list of str, default None。说明：将哪些列设置为索引列，或没有索引列。
coerce_float: 类型：bool, default True。说明：是否将非数字的列强制转换为浮点数。
params: 类型：list, tuple, dict, or None, default None。说明：SQL 查询中的参数。
parse_dates: 类型：list 或者 dict, default None。说明：指定要解析为日期的数据列。
chunksize: 类型：int, default None。说明：如果提供，每次迭代返回 DataFrame 的行数，而不是一次性读取所有数据。

4.3 返回值 📤

返回值类型：pandas.DataFrame 或者 pandas.io.sql.SQLQuery 表示的 Generator

read_sql_query 方法返回一个包含查询结果的 Pandas DataFrame，如果指定了 chunksize，则会返回一个迭代器对象，每次迭代返回一个 DataFrame。

4.4 示例代码 👨‍💻

4.4.1 执行 SQL 查询并读取结果 📄

首先，执行一个 SQL 查询并读取结果。

import pandas as pd
from sqlalchemy import create_engine

# 创建数据库连接
engine = create_engine('sqlite:///example.db')

# 执行 SQL 查询并读取结果
query = "SELECT * FROM my_table WHERE age > 30"
df = pd.read_sql_query(query, con=engine)

print("执行 SQL 查询并读取的 DataFrame：\n", df)

4.4.2 使用参数执行 SQL 查询 ⏩

接下来，我们可以使用查询参数来执行 SQL 查询。

# 使用查询参数执行 SQL 查询
query = "SELECT * FROM my_table WHERE age > ?"
params = (30,)
df = pd.read_sql_query(query, con=engine, params=params)

print("使用参数执行 SQL 查询并读取的 DataFrame：\n", df)

4.5 进阶使用 🚀

4.5.1 指定索引列读取数据 🌐

我们可以指定某个列或多个列作为 DataFrame 的索引列。

# 执行 SQL 查询并指定索引列读取数据
query = "SELECT * FROM my_table WHERE age > 30"
df = pd.read_sql_query(query, con=engine, index_col='id')

print("指定索引列执行 SQL 查询并读取的 DataFrame：\n", df)

4.5.2 使用分块读取数据 🗂️

对于较大的查询结果集，我们可以使用分块读取，以节省内存并提高效率。

# 分块读取数据，每次读取 1000 行
query = "SELECT * FROM my_table"
iterator = pd.read_sql_query(query, con=engine, chunksize=1000)

for chunk in iterator:
    print("读取到的数据块：\n", chunk)

4.5.3 解析日期列读取数据 📜

我们可以指定某些列作为日期列进行解析，以正确地处理时间数据。

# 执行 SQL 查询并解析日期列读取数据
query = "SELECT * FROM my_table"
df = pd.read_sql_query(query, con=engine, parse_dates=['date_col'])

print("解析日期列执行 SQL 查询并读取的 DataFrame：\n", df)