python分组统计数据_数据分组统计

本文介绍了Python中使用pandas的groupby语句进行数据分组统计的方法,包括单列分组、多列分组、分组变量是否作为index以及不同列应用不同统计函数等操作,并提供了具体的代码示例。
摘要由CSDN通过智能技术生成

统计分析数据的时候,经常需要进行分组统计。分组操作在python里的实现方式就是groupby语句。

惯例,咱们先造一个DataFrame表。

import pandas as pd

dic={

'class':['a','a','b','b'],

'id':[1,2,3,3],

'math':[88,66,55,22],

'physics':[99,77,33,67],

'science':[55,88,65,89]

}

df1=pd.DataFrame(data=dic,index=['student1','student2','student3','student4'])

1、单列分组

groupby语句可以单独形成一个分组对象。比如我们将数据表按照班级(class)进行分组,

后续想要进行任何的分组统计都可以使用这个分组对象。

Class_group=df1.groupby('class')

Class_group.mean()

结果为:

id math physics science

class

a 1.5 77.0 88.0 71.5

b 3.0 38.5 50.0 77.0

出现这个结果是因为我们在分组统计的时候没有指定列,所以python会将所有数值的列统计出平均值展示出来。当我们指定需要统计的列名之后,就会只展示我们需要的列。

Cla

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值