七、数据聚合和分组运算

最新推荐文章于 2024-04-22 00:29:42 发布

yinger_0131

最新推荐文章于 2024-04-22 00:29:42 发布

阅读量264

点赞数

分类专栏：数据分析文章标签：数据分析数据聚合 python

本文链接：https://blog.csdn.net/yinger_0131/article/details/79490487

版权

数据分析专栏收录该内容

17 篇文章 0 订阅

订阅专栏

1.
df[‘data1’].groupby(df[‘key1’])
调用等价于对部分列进行索引： df.groupby(df[‘key1’]) [‘data1’]

2.分组（groupby）
（1）选取一个或一组列 data.groupby(data[’ss’])[’ss1’]
（2）通过函数进行分组 dataframe.groupby(len)
（3）通过字典或者Series进行分组 data.groupby(dict)
（4）通过索引级别分组 data.groupby(level=“级别名”)
（5）自定义分组键：group_key=[‘East’]*4+[‘West’]*4

3.数据聚合（从数组产生标量值得数据转换过程）：
(1)sum，mean,min,count
(2)def 函数名：
add.函数名（通过agg调用自定义函数）

4.分组级运算(transform/apply)和转换
transform（严格条件的特殊函数）:
transform会将一个函数应用到各个分组并将结果放置到适当的位置，
如果各分组产生的是一个标量值，则改值就会被广播出去

transform传入的参数只能产生两种结果：
（1）产生一个可以广播的标量值
（2）产生一个相同大小的结果数组
apply
apply函数将对象拆分为多个片段，对各个片段调用传入的函数，并尝试将各片段合到一起。
grouped.apply(函数名)

5.分位数和桶分析
factor = pd.cut(frame.data1,4) 分成四个桶
factor对象是个划分对象可以直接groupby
grouped=data.groupby(factor)
grouped.apply(函数名)

6.透视表和交叉表
透视表：它根据一个或多个键对数据进行聚合，并根据行和列上的分组键将数据分配到各个矩形区域中。DataFrame有一个pivot_table方法，此外还有一个顶级的pandas.pivot_table函数。除能为groupby提供便利外，pivot_table还可以添加分项小计（也叫做margins）：margins=True

yinger_0131

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
七、数据聚合和分组运算

1. df[‘data1’].groupby(df[‘key1’]) 调用等价于对部分列进行索引： df.groupby(df[‘key1’]) [‘data1’]2.分组（groupby）（1）选取一个或一组列 data.groupby(data[’ss’])[’ss1’] （2）通过函数进行分组 dataframe.groupby(len) （3）通过字典或者Serie...
复制链接

扫一扫

专栏目录