pandas常用函数之合并和分组

xfysq_

已于 2023-04-07 15:52:53 修改

阅读量1k

点赞数

分类专栏： Python 文章标签： python pandas

于 2022-04-16 13:49:39 首次发布

本文链接：https://blog.csdn.net/xfysq_/article/details/124212291

版权

Python 专栏收录该内容

32 篇文章 1 订阅

订阅专栏

文章目录

前言
一、合并
二、分组（groupby）
三、聚合（agg）
四、数据透视（pivot_table）

前言

对pandas常用的函数进行了一下汇总，供自己以后回顾使用。

一、合并

1、concat

pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False,
       keys=None, levels=None, names=None, verify_integrity=False)
#axis： 需要合并链接的轴，0是行（上下），1是列（左右） 
#join：连接的方式 inner（默认，交集），或者outer（并集）
frames = [df1, df2, df3]
result = pd.concat(frames)

2、join

df1.join(df2)#以df1为基准，以索引相同的行进行合并（左右方向）

3、merge

df1.merge(df2)
#以df1为基准，以列名相同的列进行合并（左右方向）
# left:参与合并的左侧DataFrame
# right:参与合并的右侧DataFrame
# how:连接方式：‘inner’（默认，内连接）；还有，‘outer’（全连接）、‘left’（左连接）、‘right’（右连接）
# on:用于连接的列名，必须同时存在于左右两个DataFrame对象中，如果位指定，则以left和right列名的交集作为连接键
# left_on:左侧DataFarme中用作连接键的列
# right_on:右侧DataFarme中用作连接键的列
# left_index:将左侧的行索引用作其连接键
# right_index:将右侧的行索引用作其连接键
# sort:根据连接键对合并后的数据进行排序，默认为True。有时在处理大数据集时，禁用该选项可获得更好的性能
# suffixes:字符串值元组，用于追加到重叠列名的末尾，默认为（‘_x’,‘_y’）.例如，左右两个DataFrame对象都有‘data’，则结果中就会出现‘data_x’，‘data_y’
# copy:设置为False，可以在某些特殊情况下避免将数据复制到结果数据结构中。默认总是赋值

二、分组（groupby）

df.groupby(by="列名")#以某一列中不用的元素对整个DataFrame进行分组

df.groupby(by="列名1").count()["列名2"]#以列名1分组，统计1中不同元素对于列名2的数量

可选指标：
df.count()["列名"]#非nan元素的数量
df.sum()
df.mean()
df.max()
df.min()
df.median()
df.std()
df.var()

三、聚合（agg）

df.agg(func，axis)#使用指定轴上的一个或多个操作进行聚合。

四、数据透视（pivot_table）

df.pivot_table(df, index, columns, values, aggfunc)#以index为行，columns为列，values为值，
												   #填充规则为aggfunc构建新表格

xfysq_

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
pandas常用函数之合并和分组

对pandas常用的函数进行了一下汇总，供自己以后回顾使用。
复制链接

扫一扫

专栏目录