Pandas统计分析基础

一、读写不同数据源的数据
1.数据库文件的读写
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
2.文本文件的读写
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
常见的的中文编码方式有两种,‘utf_8’ 和 ‘gbk’
utf_8不能正确检码时,改用‘gbk’
在这里插入图片描述
报错:
在这里插入图片描述
原因:读取文件地址中含有中文

解决方法:engine=“python”
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
保存并删除索引列

3.Excel文件的读写
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
二、DataFrame的常用操作
基础属性
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

1.增删改查DataFrame数据
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
可以看到data2中的 ” order_id “ 都改为了45800
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2.描述分析DataFrame数据
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
三、转换与处理时间序列数据在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
四、使用分组聚合进行组内计算

  1. 使用groupby方法拆分数据
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    用groupby方法按‘order_id’分组,要的是counts和amounts两列数据

2.使用agg方法聚合数据
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
如果只对某些字段操作,可以用字典的形式,用Key来实现
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

3.使用apply方法聚合数据在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

4.使用transform方法聚合数据在这里插入图片描述
在这里插入图片描述

五、创建透视表与交叉表
1.使用pivot_table函数创建透视表在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2.使用crosstab函数创建交叉表
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
dropna=True表示把原来数据中的缺失的数值剔除,fillna(0)表示将交叉表中的缺失值填充为0

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值