1、pandas.read_sql()
2、pandas.read_sql_query()
3、pandas.read_sql_table()
read_sql是综合了read_sql_table和read_sql_query的,所以一般用read_sql就好了
pandas.read_sql(sql, con, index_col=None, coerce_float=True, params=None, parse_dates=None, columns=None, chunksize=None)
各参数意义:
- sql:sql命令字符串
- con:连接sql数据库的engine,一般可以用sqlalchemy或者pymysql之类的包建立;
- index_col:选择某一列作为index;
- coerce_float:将数字形式的字符串直接以float型读入;
- parse_dates:将某一列日期型字符串转换为datetime型数据,与pd.to_datetime功能类似。可以直接提供需要转换的列名以默认的日期形式转换,也可以用字典的格式提供列名和转换的日期格式,比如{column_name: format string}(format string:"%Y:%m:%H:%M:%S");
- columns:要选取的列,一般没啥用,因为在sql命令里面一般就指定要选择的列了;
- chunksize:如果提供了一个整数值,那么就会返回一个generator,每次输出的行数就是提供的值的大小。
设置参数con
1、用sqlalchemy构建数据库链接
import pandas as pd
import sqlalchemy
from sqlalchemy import create_engine
connect_info = 'mysql+pymysql://{}:{}@{}:{}/{}?charset=utf8'
engine = create_engine(connect_info)
sql_cmd = 'SELECT * FROM table'
df = pd.read_sql(sql=sql_cmd, con=engine)
engine.close() #使用完后记得关掉
2、用DBAPI构建数据库链接
import pandas as pd
import pymysql
conn = pymysql.connect(host=localhost, user=username, password=password, database=dbname, charset='utf8', use_unicode=True)
sql_cmd = 'SELECT * FROM table'
df = pd.read_sql(sql=sql_cmd, con=conn)
conn.close() #使用完后记得关掉