pandas如何处理pymysql返回的表数据

Channing Lewis

于 2024-09-14 21:34:36 发布

阅读量229

点赞数 3

分类专栏： Python 文章标签： pandas

本文链接：https://blog.csdn.net/lycwhu/article/details/142207247

版权

Python 专栏收录该内容

247 篇文章 2 订阅

订阅专栏

在 pandas 中，可以很方便地处理使用 pymysql 从 MySQL 数据库查询返回的数据。通常的做法是使用 pymysql 执行 SQL 查询，并将结果转换为 Pandas DataFrame 进行数据处理。

以下是具体步骤：

安装依赖:
确保你已经安装了 pandas 和 pymysql。可以使用以下命令安装：
```
pip install pandas pymysql
```
连接 MySQL 数据库并执行查询:
使用 pymysql 连接到 MySQL 数据库，执行 SQL 查询，并将结果转换为 Pandas DataFrame。

示例代码：

import pymysql
import pandas as pd

# 建立数据库连接
connection = pymysql.connect(
    host='your_host',  # 数据库地址
    user='your_username',  # 用户名
    password='your_password',  # 密码
    database='your_database',  # 数据库名称
    charset='utf8mb4'  # 字符编码
)

# 执行SQL查询并将结果转换为DataFrame
query = "SELECT * FROM your_table"
df = pd.read_sql(query, connection)

# 关闭数据库连接
connection.close()

# 查看结果
print(df.head())

解释：

连接数据库：使用 pymysql.connect 方法来连接数据库，传入数据库的 host、user、password 和 database 等参数。
执行 SQL 查询：使用 pd.read_sql()，将 SQL 查询的结果直接读取为 Pandas DataFrame。read_sql() 方法会自动将结果集转换为 DataFrame 格式。
关闭连接：在查询完成后，记得关闭数据库连接。
处理数据：一旦查询数据变为 DataFrame 后，你可以使用 Pandas 提供的各种方法对数据进行处理、分析、操作。

示例数据处理：

假设查询返回的表中有 name 和 age 两列，你可以使用 Pandas 进行进一步的数据分析和操作：

# 查看数据前5行
print(df.head())

# 筛选出 age > 30 的数据
df_filtered = df[df['age'] > 30]

# 按 name 排序
df_sorted = df.sort_values('name')

# 分组统计
age_grouped = df.groupby('age').size()