一、读写不同数据源的数据
1.数据库文件的读写
2.文本文件的读写
常见的的中文编码方式有两种,‘utf_8’ 和 ‘gbk’
utf_8不能正确检码时,改用‘gbk’
报错:
原因:读取文件地址中含有中文
解决方法:engine=“python”
保存并删除索引列
3.Excel文件的读写
二、DataFrame的常用操作
基础属性
1.增删改查DataFrame数据
可以看到data2中的 ” order_id “ 都改为了45800
2.描述分析DataFrame数据
三、转换与处理时间序列数据
四、使用分组聚合进行组内计算
- 使用groupby方法拆分数据
用groupby方法按‘order_id’分组,要的是counts和amounts两列数据
2.使用agg方法聚合数据
如果只对某些字段操作,可以用字典的形式,用Key来实现
3.使用apply方法聚合数据
4.使用transform方法聚合数据
五、创建透视表与交叉表
1.使用pivot_table函数创建透视表
2.使用crosstab函数创建交叉表
dropna=True表示把原来数据中的缺失的数值剔除,fillna(0)表示将交叉表中的缺失值填充为0