python pandas聚合_pandas分组聚合详解

本文详细介绍了如何使用pandas对数据进行分组和聚合操作,包括按列分组求均值、数量统计、迭代处理、转换为字典以及通过索引层级分组。示例展示了对DataFrame的hobby和user列进行分组并进行各种聚合函数的应用。
摘要由CSDN通过智能技术生成

一 前言

pandas学到分组迭代,那么基础的pandas系列就学的差不多了,自我感觉不错,知识追寻者用pandas处理过一些数据,蛮好用的;

知识追寻者(Inheriting the spirit of open source, Spreading technology knowledge;)

二 分组

2.1 数据准备

# -*- coding: utf-8 -*-

import pandas as pd

import numpy as np

frame = pd.DataFrame({

'user' : ['zszxz','craler','rose','zszxz','rose'],

'hobby' : ['reading','running','hiking','reading','hiking'],

'price' : np.random.randn(5),

'number' : np.random.randn(5)

})

print(frame)

输出

user    hobby     price    number

0   zszxz  reading  0.275752 -0.075841

1  craler  running -1.410682  0.259869

2    rose   hiking -0.353269 -0.392659

3   zszxz  reading  1.484604  0.659274

4    rose   hiking -1.348315  2.492047

2.2 分组求均值

提取DataFrame中price 列,根据hobby列进行分组,最后对分好组的数据进行处理求均值;

# 是个生成器

group = frame['price'].groupby(frame['hobby'])

# 求均值

print(group.mean())

输出

hobby

hiking    -0.850792

reading    0.880178

running   -1.410682

Name: price, dtype: float64

Tip: 可以理解为 根据爱好分

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值