pandas中concat/append方法

大哇唧

已于 2022-04-28 10:02:32 修改

阅读量3.1k

点赞数 2

分类专栏： pandas 文章标签：数据分析 python

于 2022-04-28 09:59:30 首次发布

本文链接：https://blog.csdn.net/sinat_41928169/article/details/124112576

版权

pandas 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

concat方法

concat⽅法类似于数据库中union all，在不同的轴方向上都可以不去重的合并数据对象

concat语法

pandas.concat(objs, axis=0, join='outer', ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False, sort=False, copy=True)

参数说明：

参数axis=0，默认按0轴连接，也可指定为其他数字按其他轴连接；参数join='outer'，默认指定另一个轴的连接方式为取并集，也可指定为inner取交集；参数ignore_index=False，默认连接的轴索引仍继承之前的DataFrame或Series索引，也可指定为True表示连接的轴索引重置为0、1……；参数keys/levels/names和构建层次索引有关，其他参数暂略

参数详解：

pandas.concat — pandas 1.4.2 documentation (pydata.org)

concat代码

#导入包
import pandas as pd

#构造数据
df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'],
                    'B': ['B0', 'B1', 'B2', 'B3'],
                    'C': ['C0', 'C1', 'C2', 'C3'],
                    'D': ['D0', 'D1', 'D2', 'D3']},
                    index=[0, 1, 2, 3])    
df2 = pd.DataFrame({'A': ['A4', 'A5', 'A6', 'A7'],
                    'B': ['B4', 'B5', 'B6', 'B7'],
                    'C': ['C4', 'C5', 'C6', 'C7'],
                    'D': ['D4', 'D5', 'D6', 'D7']},
                    index=[2, 3, 4, 5])

print('df1:\n',df1)
print('df2:\n',df2)

参数axis指定按某个轴连接，默认0，也可指定其他数字：

result1 = pd.concat([df1, df2])        #默认按axis=0连接
result2 = pd.concat([df1, df2],axis=1) #指定按axis=1连接
print('result1:\n',result1)
print('result2:\n',result2)

参数join指定另一个轴连接的⽅式，默认'outer'，也可指定‘inner’：

result1 = pd.concat([df1, df2], axis=1)                #默认join='outer'
result2 = pd.concat([df1, df2], axis=1, join='inner')  #指定join='inner'
print('result1:\n',result1)
print('result2:\n',result2)

#使用df1的索引，去掉df2特有的索引
result3 = pd.concat([df1, df2], axis=1).reindex(df1.index)
result4 = pd.concat([df1, df2.reindex(df1.index)], axis=1)
print('result3:\n',result3)
print('result4:\n',result4)

参数ignore_index，默认False，也可指定为True重置索引

result1 = pd.concat([df1, df2]) #默认ignore_index=False 
result2 = pd.concat([df1, df2], ignore_index=True)#指定ignore_index=True，从0开始重置索引 
print('result1:\n',result1) 
print('result2:\n',result2)

构建层次化索引的两种方式，1）参数keys传入序列，2）参数objs选择传入字典

#创建层次化索引的两种方式，参数keys传入序列和参数objs传入字典，或者结合起来
result1 = pd.concat([df1,df2], keys=['x', 'y'])
result2 = pd.concat({'x':df1,'y':df2},axis=1)
result3 = pd.concat({'x':df1,'y':df2,'z':df2},axis=1, keys=['z', 'x'])
print('result1:\n',result1)
print('result2:\n',result2)
print('result3:\n',result3)

#通过层次化索引读取数据
print()
print(result1.loc['x'])
print(result2.loc[:,'x'])

DataFrame和Series连接或多个Series连接

s1 = pd.Series(['X0', 'X1', 'X2', 'X3'], name='X')
s2 = pd.Series(['0', '1', '2', '3'])

#默认继承之前的索引名，没有索引名的使用0,1…
result1 = pd.concat([df1, s1, s2, s2], axis=1)
#通过ignore_index=True可以重置索引名
result2 = pd.concat([df1, s1, s2, s2], axis=1, ignore_index=True)

#通过多个Series构建DataFrame时，可通过keys参数重置索引名
result3 = pd.concat([s1, s2, s2], axis=1, keys=['red', 'blue', 'green'])

print('result1:\n',result1)
print('result2:\n',result2)
print('result3:\n',result3)

append方法

类似于concat，作用是向DataFrame或Series增加新的数据⾏

append语法

DataFrame.append的语法：

DataFrame.append(other, ignore_index=False, verify_integrity=False, sort=False)

Series.append的语法：

Series.append(to_append, ignore_index=False, verify_integrity=False)

参数说明：

参数ignore_index=False，默认行索引仍继承之前的DataFrame或Series索引，也可指定为True表示将行索引重置为0、1……；其他参数暂略

参数详解：

pandas.Series.append — pandas 1.4.2 documentation (pydata.org)

pandas.DataFrame.append — pandas 1.4.2 documentation (pydata.org)

append代码

append两个对象或多个对象

df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'],
                    'B': ['B0', 'B1', 'B2', 'B3'],
                    'C': ['C0', 'C1', 'C2', 'C3'],
                    'D': ['D0', 'D1', 'D2', 'D3']},
                    index=[0, 1, 2, 3])   
df2 = pd.DataFrame({'A': ['A4', 'A5', 'A6', 'A7'],
                    'B': ['B4', 'B5', 'B6', 'B7'],
                    'C': ['C4', 'C5', 'C6', 'C7'],
                    'D': ['D4', 'D5', 'D6', 'D7']},
                    index=[2, 3, 4, 5])
df3 = pd.DataFrame({'B': ['B2', 'B3', 'B6', 'B7'],
                    'D': ['D2', 'D3', 'D6', 'D7'],
                    'F': ['F2', 'F3', 'F6', 'F7']},
                    index=[2, 3, 6, 7])

result1 = df1.append(df2)             #连接两个对象df1和df2
result2 = df1.append([df2, df3])      #连接多个对象
print('result1:\n',result1)
print('result2:\n',result2)

参数ignore_index，默认False，也可指定为True重置索引

result1 = df1.append(df2) #默认ignore_index=False 
result2 = df1.append(df2, ignore_index=True) #指定ignore_index=True，从0开始重置索引 
print('result1:\n',result1) 
print('result2:\n',result2)

DataFrame和Series或字典连接

#DataFrame和Series连接
s = pd.Series(['X0', 'X1', 'X2', 'X3'], index=['A', 'B', 'C', 'D'])
result1 = df1.append(s, ignore_index=True)
print('result1:\n',result1)

#DataFrame和字典连接
dicts = [{'A': 1, 'B': 2, 'C': 3, 'X': 4},{'A': 5, 'B': 6, 'C': 7, 'Y': 8}]
result2 = df1.append(dicts, ignore_index=True)
print('result2:\n',result2)

参考资料：Merge, join, and concatenate | Pandas 中文 (pypandas.cn)

大哇唧

关注

2
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
pandas中concat/append方法

concatconcat⽅法类似于数据库中的不去重的全连接(UNION ALL)，可以指定按某个轴连接axis(参数0/1等数字)，也可以指定另一个轴连接的⽅式join(参数可选择outer/inner)。concat的语法：pandas.concat(objs, axis=0, join='outer', ignore_index=False,keys=None, levels=None, names=None, verify_integrity=False, copy=True):imp
复制链接

扫一扫