pandas实现数据的合并concat--未完

最新推荐文章于 2022-11-09 10:04:08 发布

借無常一肘

最新推荐文章于 2022-11-09 10:04:08 发布

阅读量159

点赞数

分类专栏： python笔记文章标签： python

本文链接：https://blog.csdn.net/m0_51230647/article/details/109034515

版权

python笔记专栏收录该内容

20 篇文章 0 订阅

订阅专栏

#使用场景批量合并相同格式的excel，或者给DataFrame添加行，给DataFrame添加列
#可以使用某种合并方式（inner/outer）；沿着某个轴向（axis=0/1）；把多个pandas对象（DataFrame/Series）合并成一个；
concat相当于堆积，语法：
pandas.concat(objs,axis=0,join='outer',ignore_index=False)
objs:一个列表，内容可以是DataFrame或者Series,可以混合 
join：合并的时候索引的方式，默认是outer，也可以inner 
ignore_index:是否忽略掉原来的数据索引,产生一个新的index

append语法 : DataFrame.append(other,ignore_index=False)
append 只有按照行合并，没有按照列合并，相当于concat 按行的简写形式，也就把一个表放在另一个表的下面 
other：单个DataFrame,Series,dit,hasattr者列表

import pandas as pd 
import warnings
warnings.filterwarnings('ignore')
df1 = pd.DataFrame({'A':['A0','A1','A2','A3'],
                    'B':['B0','B1','B2','B3'],
                    'C':['C0','C1','C2','C3'],
                    'D':['D0','D1','D2','D3'],
                    'E':['E0','E1','E2','E3'],
 })
df2 = pd.DataFrame({'A':['A4','A5','A6','A7'],
                    'B':['B4','B5','B6','B7'],
                    'C':['C4','C5','C6','C7'],
                    'D':['D4','D5','D6','D7'],
                    'F':['F4','F5','F6','F7'],    
})

df1

	A	B	C	D	E
0	A0	B0	C0	D0	E0
1	A1	B1	C1	D1	E1
2	A2	B2	C2	D2	E2
3	A3	B3	C3	D3	E3

df2

	A	B	C	D	F
0	A4	B4	C4	D4	F4
1	A5	B5	C5	D5	F5
2	A6	B6	C6	D6	F6
3	A7	B7	C7	D7	F7

pd.concat([df1,df2])#concat就是两个表上下叠在一起，如果列名不同则填充NaN

	A	B	C	D	E	F
0	A0	B0	C0	D0	E0	NaN
1	A1	B1	C1	D1	E1	NaN
2	A2	B2	C2	D2	E2	NaN
3	A3	B3	C3	D3	E3	NaN
0	A4	B4	C4	D4	NaN	F4
1	A5	B5	C5	D5	NaN	F5
2	A6	B6	C6	D6	NaN	F6
3	A7	B7	C7	D7	NaN	F7

pd.concat([df1,df2],ignore_index=True)

	A	B	C	D	E	F
0	A0	B0	C0	D0	E0	NaN
1	A1	B1	C1	D1	E1	NaN
2	A2	B2	C2	D2	E2	NaN
3	A3	B3	C3	D3	E3	NaN
4	A4	B4	C4	D4	NaN	F4
5	A5	B5	C5	D5	NaN	F5
6	A6	B6	C6	D6	NaN	F6
7	A7	B7	C7	D7	NaN	F7

#使用join=inner过滤掉不匹配的列
pd.concat([df1,df2],ignore_index=True,join='inner')

	A	B	C	D
0	A0	B0	C0	D0
1	A1	B1	C1	D1
2	A2	B2	C2	D2
3	A3	B3	C3	D3
4	A4	B4	C4	D4
5	A5	B5	C5	D5
6	A6	B6	C6	D6
7	A7	B7	C7	D7

#添加一列Series
s1 = pd.Series(list(range(4)),name = 'F')
pd.concat([df1,s1],axis = 1)

	A	B	C	D	E	F
0	A0	B0	C0	D0	E0	0
1	A1	B1	C1	D1	E1	1
2	A2	B2	C2	D2	E2	2
3	A3	B3	C3	D3	E3	3

#添加多列Series
s2 = df1.apply(lambda x:x['A']+'_GG',axis = 1)
s2

0    A0_GG
1    A1_GG
2    A2_GG
3    A3_GG
dtype: object

s2.name = 'G'

pd.concat([df1,s1,s2],axis=1)

	A	B	C	D	E	F	G
0	A0	B0	C0	D0	E0	0	A0_GG
1	A1	B1	C1	D1	E1	1	A1_GG
2	A2	B2	C2	D2	E2	2	A2_GG
3	A3	B3	C3	D3	E3	3	A3_GG

pd.concat([df1,s1,s2],axis=0)

	0	A	B	C	D	E
0	NaN	A0	B0	C0	D0	E0
1	NaN	A1	B1	C1	D1	E1
2	NaN	A2	B2	C2	D2	E2
3	NaN	A3	B3	C3	D3	E3
0	0	NaN	NaN	NaN	NaN	NaN
1	1	NaN	NaN	NaN	NaN	NaN
2	2	NaN	NaN	NaN	NaN	NaN
3	3	NaN	NaN	NaN	NaN	NaN
0	A0_GG	NaN	NaN	NaN	NaN	NaN
1	A1_GG	NaN	NaN	NaN	NaN	NaN
2	A2_GG	NaN	NaN	NaN	NaN	NaN
3	A3_GG	NaN	NaN	NaN	NaN	NaN

pd.concat([s1,s2],axis=1)

	F	G
0	0	A0_GG
1	1	A1_GG
2	2	A2_GG
3	3	A3_GG

pd.concat([s1,df1,s2],axis=1)

	F	A	B	C	D	E	G
0	0	A0	B0	C0	D0	E0	A0_GG
1	1	A1	B1	C1	D1	E1	A1_GG
2	2	A2	B2	C2	D2	E2	A2_GG
3	3	A3	B3	C3	D3	E3	A3_GG

#append()函数
df001 = pd.DataFrame([[1,2],[3,4]],columns = list('AB'))
df002 = pd.DataFrame([[5,6],[7,8]],columns = list('AB'))
df001

	A	B
0	1	2
1	3	4

df002

	A	B
0	5	6
1	7	8

df001.append(df002)

	A	B
0	1	2
1	3	4
0	5	6
1	7	8

df003 = pd.DataFrame([[9,10],[11,12]],columns = list('CD'))
df003

	C	D
0	9	10
1	11	12

df001.append(df003)

	A	B	C	D
0	1.0	2.0	NaN	NaN
1	3.0	4.0	NaN	NaN
0	NaN	NaN	9.0	10.0
1	NaN	NaN	11.0	12.0

#可以一行一行的给DataFrame添加数据
df = pd.DataFrame(columns=['A'])#这是创建一个空的df,注意列名需要用中括号[]
df

	A

#for循环，每次添加一行值
for i in range(5):
    df = df.append({'A':i},ignore_index=True)
df
#注意这里的append新的用法，以及循环添加值是用过字典的方式{}添加的。

	A
0	0
1	1
2	2
3	3
4	4

借無常一肘

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
pandas实现数据的合并concat--未完

#使用场景批量合并相同格式的excel，或者给DataFrame添加行，给DataFrame添加列#可以使用某种合并方式（inner/outer）；沿着某个轴向（axis=0/1）；把多个pandas对象（DataFrame/Series）合并成一个；concat相当于堆积，语法：pandas.concat(objs,axis=0,join='outer',ignore_index=False)objs:一个列表，内容可以是DataFrame或者Series,可以混合 join：合并的时候索引的方
复制链接

扫一扫

专栏目录

	A	B	C	D	E	F
0	A0	B0	C0	D0	E0	NaN
1	A1	B1	C1	D1	E1	NaN
2	A2	B2	C2	D2	E2	NaN
3	A3	B3	C3	D3	E3	NaN
0	A4	B4	C4	D4	NaN	F4
1	A5	B5	C5	D5	NaN	F5
2	A6	B6	C6	D6	NaN	F6
3	A7	B7	C7	D7	NaN	F7

	A	B	C	D	E	F
0	A0	B0	C0	D0	E0	NaN
1	A1	B1	C1	D1	E1	NaN
2	A2	B2	C2	D2	E2	NaN
3	A3	B3	C3	D3	E3	NaN
4	A4	B4	C4	D4	NaN	F4
5	A5	B5	C5	D5	NaN	F5
6	A6	B6	C6	D6	NaN	F6
7	A7	B7	C7	D7	NaN	F7

	A	B	C	D
0	A0	B0	C0	D0
1	A1	B1	C1	D1
2	A2	B2	C2	D2
3	A3	B3	C3	D3
4	A4	B4	C4	D4
5	A5	B5	C5	D5
6	A6	B6	C6	D6
7	A7	B7	C7	D7

	A	B	C	D	E	F
0	A0	B0	C0	D0	E0	NaN
1	A1	B1	C1	D1	E1	NaN
2	A2	B2	C2	D2	E2	NaN
3	A3	B3	C3	D3	E3	NaN
0	A4	B4	C4	D4	NaN	F4
1	A5	B5	C5	D5	NaN	F5
2	A6	B6	C6	D6	NaN	F6
3	A7	B7	C7	D7	NaN	F7

	A	B	C	D	E	F
0	A0	B0	C0	D0	E0	NaN
1	A1	B1	C1	D1	E1	NaN
2	A2	B2	C2	D2	E2	NaN
3	A3	B3	C3	D3	E3	NaN
4	A4	B4	C4	D4	NaN	F4
5	A5	B5	C5	D5	NaN	F5
6	A6	B6	C6	D6	NaN	F6
7	A7	B7	C7	D7	NaN	F7

	A	B	C	D
0	A0	B0	C0	D0
1	A1	B1	C1	D1
2	A2	B2	C2	D2
3	A3	B3	C3	D3
4	A4	B4	C4	D4
5	A5	B5	C5	D5
6	A6	B6	C6	D6
7	A7	B7	C7	D7

pandas实现数据的合并concat--未完

“相关推荐”对你有帮助么？

	A	B	C	D	E	F
0	A0	B0	C0	D0	E0	NaN
1	A1	B1	C1	D1	E1	NaN
2	A2	B2	C2	D2	E2	NaN
3	A3	B3	C3	D3	E3	NaN
0	A4	B4	C4	D4	NaN	F4
1	A5	B5	C5	D5	NaN	F5
2	A6	B6	C6	D6	NaN	F6
3	A7	B7	C7	D7	NaN	F7

	A	B	C	D	E	F
0	A0	B0	C0	D0	E0	NaN
1	A1	B1	C1	D1	E1	NaN
2	A2	B2	C2	D2	E2	NaN
3	A3	B3	C3	D3	E3	NaN
4	A4	B4	C4	D4	NaN	F4
5	A5	B5	C5	D5	NaN	F5
6	A6	B6	C6	D6	NaN	F6
7	A7	B7	C7	D7	NaN	F7

	A	B	C	D
0	A0	B0	C0	D0
1	A1	B1	C1	D1
2	A2	B2	C2	D2
3	A3	B3	C3	D3
4	A4	B4	C4	D4
5	A5	B5	C5	D5
6	A6	B6	C6	D6
7	A7	B7	C7	D7