Pandas数据可以实现纵向和横向连接,将数据连接后会形成一个新对象(Series或DataFrame)
连接是最常用的多个数据合并操作
pd.concat()是专门用于数据连接合并的函数,它可以沿着行或列进行操作,同时可以指定非合并轴的合并方式(如合集、交集等)
pd.concat()会返回一个合并后的DataFrame
语法
1 2 3 |
|
参数
- objs: 需要连接的数据,可以是多个DataFrame或者Series,它是必传参数
- axis: 连接轴的方法,默认值为0,即按行连接,追加在行后面;值为1时追加到列后面(按列连接:axis=1)
- join: 合并方式,其他轴上的数据是按交集(inner)还是并集(outer)进行合并
- ignore_index: 是否保留原来的索引
- keys: 连接关系,使用传递的键作为最外层级别来构造层次结构索引,就是给每个表指定一个一级索引
- names: 索引的名称,包括多层索引
- verify_integrity: 是否检测内容重复;参数为True时,如果合并的数据与原数据包含索引相同的行,则会报错
- copy: 如果为False,则不要深拷贝
1.按行连接
pd.concat()的基本操作可以实现df.append()功能
操作中ignore_index和sort参数的作用是一样的,axis默认取值为0,即按行连接
1 2 3 4 5 6 |
|