Python pandas 读取数据库操作

最新推荐文章于 2024-08-19 10:52:43 发布

追丰少年

最新推荐文章于 2024-08-19 10:52:43 发布

阅读量2.0k

点赞数

分类专栏： Pandas数据分析文章标签： python pandas 开发语言

本文链接：https://blog.csdn.net/Ghjkku/article/details/131364726

版权

Pandas数据分析专栏收录该内容

53 篇文章 10 订阅

订阅专栏

文章介绍了pandas的几个函数，如read_sql、read_sql_query和read_sql_table，用于从SQL数据库获取数据。read_sql作为综合函数，通常足够使用。它接受SQL命令字符串和数据库连接引擎作为参数，并提供了如index_col、coerce_float和parse_dates等选项来定制数据加载。文章还展示了如何通过sqlalchemy和pymysql建立数据库连接进行数据读取。

摘要由CSDN通过智能技术生成

1、pandas.read_sql()

2、pandas.read_sql_query()

3、pandas.read_sql_table()

read_sql是综合了read_sql_table和read_sql_query的，所以一般用read_sql就好了

pandas.read_sql(sql, con, index_col=None, coerce_float=True, params=None, parse_dates=None, columns=None, chunksize=None)

各参数意义：

sql：sql命令字符串
con：连接sql数据库的engine，一般可以用sqlalchemy或者pymysql之类的包建立；
index_col：选择某一列作为index；
coerce_float：将数字形式的字符串直接以float型读入；
parse_dates：将某一列日期型字符串转换为datetime型数据，与pd.to_datetime功能类似。可以直接提供需要转换的列名以默认的日期形式转换，也可以用字典的格式提供列名和转换的日期格式，比如{column_name: format string}（format string："%Y:%m:%H:%M:%S"）；
columns：要选取的列，一般没啥用，因为在sql命令里面一般就指定要选择的列了；
chunksize：如果提供了一个整数值，那么就会返回一个generator，每次输出的行数就是提供的值的大小。

设置参数con

1、用sqlalchemy构建数据库链接

import pandas as pd
import sqlalchemy
from sqlalchemy import create_engine
 
connect_info = 'mysql+pymysql://{}:{}@{}:{}/{}?charset=utf8'
engine = create_engine(connect_info)
 
sql_cmd = 'SELECT * FROM table'
df = pd.read_sql(sql=sql_cmd, con=engine)
engine.close()  #使用完后记得关掉

2、用DBAPI构建数据库链接

import pandas as pd
import pymysql
 
conn = pymysql.connect(host=localhost, user=username, password=password, database=dbname, charset='utf8', use_unicode=True)
 
sql_cmd = 'SELECT * FROM table'
df = pd.read_sql(sql=sql_cmd, con=conn)
conn.close()  #使用完后记得关掉