groupby python_Python数据清洗学习笔记(七):数据统计

这一节数据统计,我们从以下四个方面学习:

1.数据分组方法

2.聚合函数使用

3.apply函数

4.透视图与交叉表

数据分组会生成一个Groupby对象,这个对象有很多方法供我们使用,我们先学会一些常用的即可,后续可自行学习。

6406d29cd195c42c902875cb1d56cc78.png

一:数组分组方法

df.groupby(by=)  #可接收字符串,列表等

Groupby对象方法:

1.mean方法

2.sum方法

3.maxmin方法

等等.................

49a5b14253741a877090e699c24aa084.png

二:聚合函数使用

Groupby.agg(func)    #可以为内置函数,自定义函数或者匿名函数
c122989312d60b288c8c69dc2bd6d376.png

三:apply函数

Groupby.apply(func)  #此方法也可用于dataframe数据
136daa72124d824a484bbca4bc5c2dfd.png

四:透视图与交叉表

透视图:根据行或列对数据进行统计

pd.pivot_table(data,index,columns,values,aggfunc,margins)

data:数据

index:行分组键

columns:列分组键

values:分组的字段

aggfunc:聚合函数

margins:是否需要统计

28b9bd4124af45faf776181b7bd63257.png

交叉表:用于计算分组频率

pd.crosstable(data,index)
2933691b08cdc7587724deb2e1bc5008.png

Python数据清洗学习笔记(六):数据转换

Python数据清洗学习笔记(五):数据表的处理

Python数据清洗学习笔记(四):文件读写

Python数据清洗学习笔记(三):Pandas常用数据结构

Python数据清洗学习笔记(二):numpy的常用数据清洗函数

Python数据清洗学习笔记(一):numpy常用数据结构

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值