数据分析之分组分析

#-*- coding: utf-8 -*-
#1、概念:分组分析,是指根据分组字段,将分析对象划分成不同的部分,以进行对比分析各组之间的差异的一种分析方法。
#定性分组:根据事物的已有类别进行划分,如性别、年龄、地区等
#定量分组:即数值分组,
#2、常用的统计指标:计数、求和、平均值等

#3、分组统计函数:
#groupby(by=[分组列1,分组列2,...])[统计列1,统计列2,...].agg({统计列别名1:统计函数1,统计列别名2:统计函数2,...})

#参数说明:
#by:用于分组的列
#中括号:用于统计的列
#agg:统计别名显示统计值的名称,统计函数用于统计数据

import numpy
import pandas

data = pandas.read_csv("D:/python/workspace/pythonStudy/25.csv")

#25.csv包括列:class,name,score。下载地址:https://pan.baidu.com/s/1Y2fCJKn44vH8NmMFpBicPg

aggResult = data.groupby(by=['class']) ['score'].agg({'总分':numpy.sum,'人数':numpy.size,'平均成绩':numpy.mean})
 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值