pandas之GroupBy分割、应用、组合

最新推荐文章于 2023-02-16 00:38:28 发布

reb0rn初代

最新推荐文章于 2023-02-16 00:38:28 发布

阅读量825

点赞数

分类专栏：数据分析与数据挖掘

本文链接：https://blog.csdn.net/qq_34195441/article/details/102541995

版权

1、pandas的累计方法

指标	描述
count()	计数项
first()、last()	第一项与最后一项
mean()、median()	均值与中位数
min()、max()	最小值与最大值
std()、var()	标准差与方差
mad()	均值绝对偏差
prod()	所有项乘积
sum()	所有项求和

2、基本操作

以DataFrame为例：

import pandas as pd
import numpy as np
df = pd.DataFrame({'key1':['a','a','b','b','a'],
                   'key2':['one','two','one','two','one'],
                   'data1':np.random.randn(5),
                   'data2':np.random.randn(5)})
df
Out[3]: 
  key1 key2     data1     data2
0    a  one -1.564426 -1.589963
1    a  two -1.134103  1.373968
2    b  one -1.110338  2.098225
3    b  two -1.521382  1.614122
4    a  one  0.796902 -1.690550

（1）按key1进行分组，计算data1列的平均值
①访问data1，根据key1调用groupby，mean计算

grouped = df['data1'].groupby(df['key1']) 
grouped
Out[5]: <pandas.core.groupby.generic.SeriesGroupBy object at 0x00000285BD1735C0>
grouped.mean()
Out[6]: 
key1
a   -0.633876
b   -1.315860
Name

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

reb0rn初代

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
pandas之GroupBy分割、应用、组合

1、pandas的累计方法指标描述 count() 计数项 first()、last() 第一项与最后一项 mean()、median() 均值与中位数 min()、max() 最小值与最大值 std()、var() 标准差与方差 mad() 均值绝对偏差 prod() 所有项乘积 sum() 所有项求和...
复制链接

扫一扫