concat()
函数是 Pandas 中用于沿指定轴将多个 DataFrame 或 Series 连接在一起的函数。它可以按行或按列将多个对象连接在一起,可以根据索引或者按照指定的轴进行连接。
下面是 concat()
函数的基本语法:
pd.concat(objs, axis=0, join='outer', ignore_index=False, keys=None, ...)
其中的参数含义如下:
objs
:要连接的多个 DataFrame 或 Series 的列表,可以是一个列表、元组或字典等。axis
:指定连接的轴,0
表示按行连接,1
表示按列连接,默认为0
。join
:指定连接的方式,可选值为'outer'
和'inner'
,默认为'outer'
。'outer'
表示对所有索引进行并集,缺失值用 NaN 填充;'inner'
表示对所有索引进行交集。ignore_index
:是否忽略连接后的索引,默认为False
。如果设置为True
,则会重新生成一个新的整数索引。keys
:用于创建层次化索引的键,如果传入列表或数组,这些键将被用作最外层级别的索引。
下面是一些示例说明 concat()
函数的用法:
按行连接多个 DataFrame:
import pandas as pd
# 创建两个示例 DataFrame
df1 = pd.DataFrame({'A': [1, 2], 'B': [3, 4]})
df2 = pd.DataFrame({'A': [5, 6], 'B': [7, 8]})
# 按行连接两个 DataFrame
result = pd.concat([df1, df2])
print(result)
按列连接多个 DataFrame:
# 创建两个示例 DataFrame
df1 = pd.DataFrame({'A': [1, 2], 'B': [3, 4]})
df2 = pd.DataFrame({'C': [5, 6], 'D': [7, 8]})
# 按列连接两个 DataFrame
result = pd.concat([df1, df2], axis=1)
print(result)
按列连接时忽略索引:
# 创建两个示例 DataFrame
df1 = pd.DataFrame({'A': [1, 2], 'B': [3, 4]}, index=[0, 1])
df2 = pd.DataFrame({'A': [5, 6], 'B': [7, 8]}, index=[2, 3])
# 按列连接两个 DataFrame,并忽略索引
result = pd.concat([df1, df2], axis=1, ignore_index=True)
print(result)