pandas操作mysql从放弃到入门
目录
什么是pandas
一、如何读取数据库-read_sql
二、如何筛选数据
三、如何连表-merge
四、如何删除一行或一列-drop
五、如何分组统计-groupyby
六、如何排序-sort_values/sort_index
七、如何重建索引-groupby(as_index=False)/reset_index
八、如何翻转dataframe-T
九、如何重命名列-rename
十、如何强制转换类型-astype
十一、如何在只有一列的情况下groupby并count-size
十二、如何操作时间-.dt.
十三、如何操作字符串-.str.
十四、如何进行数据透视-pivot/pivot_table
十五、如何进行可视化-plot
什么是pandas
pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。
Pandas纳入了大量库和一些标准的数据模型,提供了大量能使我们快速便捷地处理数据的函数和方法。
主要包含两种数据类型:Series和DataFrame
Series可以理解为dict的升级版本,主数组存放numpy数据类型,index数据存放索引
DataFrame相当于多维的Series,有两个索引数组,分别是行索引和列索引,可以理解成Series组成的字典
相关帮助文档
一、如何读取数据库-read_sql
示例代码如下
from sqlalchemy import create_engine
import pandas as pd
username = '用户名'
password = '密码'
host = '连接地址'
db = '数据库'
port = 端口号
link = f'''mysql+pymysql://{username}:{password}@{host}:{port}/{db}?charset=utf8'''
engine = create_engine(link, pool_recycle=3600)
核心方法read_sql
log:pd.DataFrame = pd.read_sql("SELECT * FROM log ORDER BY id DESC ",engine)
执行结果如下
二、如