需求:数据存储在mysql数据库中,使用Python读取数据为DataFrame结构,并处理数据
环境:ubuntu16.04、mysl5.7、python3.9(安装pymysql、sqlalchemy、pandas库)
- 导入数据
import sqlalchemy
import pandas as pd
- 创建一个连接引擎
engine = sqlalchemy.create_engine("mysql+pymysql://root:your_password@127.0.0.1:3306/database_name?charset=utf8")
create_engine
参数说明:create_engine("数据库类型+数据库驱动://数据库用户名:数据库密码@IP地址:端口/数据库", 其他参数)
- 将sql查询命令结果存储到DataFrame中
sql_query = "SELECT * FROM amazon"
df = pd.read_sql(sql=sql_query, con=engine)