pandas数据处理学习笔记(八)

导入模块

import pandas as pd

 1.groupby迭代操作

frame = pd.DataFrame({'color':['yellow','red','green','red','green'],
                      'object':['pen','pencil','pencil','ashtray','pen'],
                      'price1':[5.56,4.2,1.3,0.56,2.75],
                      'price2':[4.75,4.12,1.6,0.75,3.15]})
for name,group in frame.groupby('color'):
    print(name)
    print(group)
'''
green
   color  object  price1  price2
2  green  pencil    1.30    1.60
4  green     pen    2.75    3.15
red
  color   object  price1  price2
1   red   pencil    4.20    4.12
3   red  ashtray    0.56    0.75
yellow
    color object  price1  price2
0  yellow    pen    5.56    4.75
'''

2.分组函数

frame = pd.DataFrame({'color':['yellow','red','green','red','green'],
                      'object':['pen','pencil','pencil','ashtray','pen'],
                      'price1':[5.56,4.2,1.3,0.56,2.75],
                      'price2':[4.75,4.12,1.6,0.75,3.15]})
group = frame.groupby('color')
group['price1'].quantile(0.6)  #quantile()函数计算分位数
'''
color
green     2.170
red       2.744
yellow    5.560
'''

自定义聚合函数

定义好一个函数,将其作为参数传给agg()函数

def range(series):
    return series.max()-series.min()
group['price1'].agg(range)
'''
color
green     1.45
red       3.64
yellow    0.00
'''

对整个DataFrame对象用agg()函数

def range(series):
    return series.max()-series.min()
group.agg(range)

 同时使用多个聚合函数

group['price1'].agg([range,'mean','std'])


参考:

法比奥·内利. Python数据分析实战:第2版.北京:人民邮电出版社, 2019.11.

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值