前言
- 将俩个或者多个DataFrame合并在一起,这样的操作在日常工作中是极为频繁的一件事情,目前,我所知的有四种将DataFrame合并在一起 的方法:
- concat,在Series中也可以使用
- merge
- join
concat合并
- 这种合并实际上是直接将俩个DataFrame简单粗暴的合在了一起,可以横着合并,也可以竖着合并,5个重要参数
- axis: 指定连接轴,默认为0
- join:指定连接方式,默认为外连接
- keys:可以用来区分不同的数据组
- join_axes: 指定连接的结果集当中要保留的索引
- ingnore_index: 忽略原来连接的索引,创建新的整数序列索引,默认为False
- 代码实例
# 创建俩个DataFrame数据集 df = pd.DataFrame([[1, 2, 3], [4, 5, 6]]) df2 = pd.DataFrame([[10, 20, 30], [40, 50, 60]], columns=[0, 2, 3]) display(df, df2)
# axis指定合并的方向。axis=0(默认),竖直方向上合并。axis=1,水平方向上合并。 pd.concat((df, df2), axis=1)
R# DataFrame是根据索引(标签)进行对齐的。 pd.concat((df, df2), axis