数据分析-数据合并与重塑(concat,append,merger,join,combine_first,update )

最新推荐文章于 2023-04-21 23:09:48 发布

帅泽泽

最新推荐文章于 2023-04-21 23:09:48 发布

阅读量993

点赞数

分类专栏： pandas 文章标签：数据分析

本文链接：https://blog.csdn.net/weixin_44633951/article/details/109868365

版权

1. concat

concat函数是在pandas底下的方法，可以将数据根据不同的轴作简单的融合，默认axis=0连接

pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False,
       keys=None, levels=None, names=None, verify_integrity=False)

常用参数说明:

objs: series，dataframe或者是panel构成的序列lsit， 必须是可迭代的
axis：需要合并链接的轴，0是行，1是列
join：连接的方式 inner，或者outer，默认是inner
key：识别数据源自于哪张表

# 现将表构成list，然后在作为concat的输入
In [4]: frames = [df1, df2, df3] # 多个dataframe 

In [5]: result = pd.concat(frames)

在这里插入图片描述
要在相接的时候在加上一个层次的key来识别数据源自于哪张表，可以增加key参数

In [6]: result = pd.concat(frames, keys=['x', 'y', 'z'])

在这里插入图片描述

当axis = 1的时候，concat就是行对齐，然后将不同列名称的两张表合并

In [9]: result = pd.concat([df1, df4], axis=1)

在这里插入图片描述

加上join参数的属性，如果为’inner’得到的是两表的交集，如果是outer，得到的是两表的并集

In [10]: result = pd.concat([df1, df4], axis=1, join='inner')

在这里插入图片描述

如果两个表的index都没有实际含义，使用ignore_index参数，置true，合并的两个表就只根据列字段对齐，无视index，然后合并。最后再重新整理一个新的index。

在这里插入图片描述

前面提到的keys参数可以用来给合并后的表增加key来区分不同的表数据来源

In [27]: result = pd.concat(frames, keys=['x', 'y', 'z'])

在这里插入图片描述

In [28]: pieces = {
   'x': df1, 'y': df2, 'z': df3}

In [29]: result = pd.concat(pieces)

在这里插入图片描述

关注

专栏目录