#-*- coding: utf-8 -*-
#1、概念:分组分析,是指根据分组字段,将分析对象划分成不同的部分,以进行对比分析各组之间的差异的一种分析方法。
#定性分组:根据事物的已有类别进行划分,如性别、年龄、地区等
#定量分组:即数值分组,
#2、常用的统计指标:计数、求和、平均值等
#3、分组统计函数:
#groupby(by=[分组列1,分组列2,...])[统计列1,统计列2,...].agg({统计列别名1:统计函数1,统计列别名2:统计函数2,...})
#参数说明:
#by:用于分组的列
#中括号:用于统计的列
#agg:统计别名显示统计值的名称,统计函数用于统计数据
import numpy
import pandas
data = pandas.read_csv("D:/python/workspace/pythonStudy/25.csv")
#25.csv包括列:class,name,score。下载地址:https://pan.baidu.com/s/1Y2fCJKn44vH8NmMFpBicPg
aggResult = data.groupby(by=['class']) ['score'].agg({'总分':numpy.sum,'人数':numpy.size,'平均成绩':numpy.mean})
数据分析之分组分析
最新推荐文章于 2024-04-15 20:52:02 发布