1、pandas的累计方法
指标 | 描述 |
count() | 计数项 |
first()、last() | 第一项与最后一项 |
mean()、median() | 均值与中位数 |
min()、max() | 最小值与最大值 |
std()、var() | 标准差与方差 |
mad() | 均值绝对偏差 |
prod() | 所有项乘积 |
sum() | 所有项求和 |
2、基本操作
以DataFrame为例:
import pandas as pd
import numpy as np
df = pd.DataFrame({'key1':['a','a','b','b','a'],
'key2':['one','two','one','two','one'],
'data1':np.random.randn(5),
'data2':np.random.randn(5)})
df
Out[3]:
key1 key2 data1 data2
0 a one -1.564426 -1.589963
1 a two -1.134103 1.373968
2 b one -1.110338 2.098225
3 b two -1.521382 1.614122
4 a one 0.796902 -1.690550
(1)按key1进行分组,计算data1列的平均值
①访问data1,根据key1调用groupby,mean计算
grouped = df['data1'].groupby(df['key1'])
grouped
Out[5]: <pandas.core.groupby.generic.SeriesGroupBy object at 0x00000285BD1735C0>
grouped.mean()
Out[6]:
key1
a -0.633876
b -1.315860
Name