Python数据框的合并(二) -- concat函数

        在Python模块Pandas中,concat 函数是一个常用的函数,用于将多个pandas对象(如Series、DataFrame)沿着一条轴进行连接,下面是对Pandas concat 函数的详细解释以及代码示例。

Pandas concat函数详解

concat 函数的基本语法如下:

pandas.concat(objs, axis=0, join='outer', ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False, sort=False)

参数解释:

  • objs: 需要连接的pandas对象(Series或DataFrame)的序列或映射;
  • axis: 连接的轴,默认为0,即按行连接;如果为1,则按列连接;
  • join: 连接方式,默认为'outer',表示外连接;'inner'表示内连接;
  • ignore_index: 是否重置索引,默认为False;
  • keys: 可选参数,用于在连接时添加层次化索引中的键;
  • levels: 用于构建多层索引的参数;
  • names: 用于结果中索引的名称;
  • verify_integrity: 检查是否有重复项,默认为False;
  • sort: 对列标签进行排序,默认为False。

代码示例

示例1:按行连接两个DataFrame

import pandas as pd 

# 创建两个DataFrame 
df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'], 
'B': ['B0', 'B1', 'B2', 'B3'], 
'C': ['C0', 'C1', 'C2', 'C3'], 
'D': ['D0', 'D1', 'D2', 'D3']}, 
index=[0, 1, 2, 3]) 

df2 = pd.DataFrame({'A': ['A4', 'A5', 'A6', 'A7'], 
'B': ['B4', 'B5', 'B6', 'B7'], 
'C': ['C4', 'C5', 'C6', 'C7'], 
'D': ['D4', 'D5', 'D6', 'D7']}, 
index=[4, 5, 6, 7]) 

# 使用concat函数按行连接两个DataFrame 
result = pd.concat([df1, df2]) 
print(result)

示例2:按列连接两个DataFrame

# 假设我们有两个具有相同索引的DataFrame
df3 = pd.DataFrame({'E': ['E0', 'E1', 'E2', 'E3'],
'F': ['F0', 'F1', 'F2', 'F3']},
index=[0, 1, 2, 3])

# 使用concat函数按列连接两个DataFrame
result_col = pd.concat([df1, df3], axis=1)
print(result_col)

示例3:使用keys参数

# 使用keys参数添加层次化索引
result_keys = pd.concat([df1, df2], keys=['df1', 'df2'])
print(result_keys)

注意事项

  • 当连接DataFrame时,如果列名不完全相同,则结果DataFrame将包含所有唯一的列名,并且缺失的列将填充为NaN。
  • 如果在连接时遇到索引冲突(例如,两个DataFrame具有相同的索引),则可以通过设置ignore_index=True来重置索引。
  • 使用keys参数时,结果DataFrame将具有一个额外的索引级别,该级别由keys参数中的值组成。
  • 14
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值