merge( )合并需要指定连接键。
多对一的合并操作
on参数
指明单个连接键
In [5]: df1=pd.DataFrame({
'key':['b','b','a','a','b','a','c'],'data1':range(7)})
In [6]: df2=pd.DataFrame({
'key':['a','b','d'],'data2':range(3)})
In [7]: df1
Out[7]:
data1 key
0 0 b
1 1 b
2 2 a
3 3 a
4 4 b
5 5 a
6 6 c
In [8]: df2
Out[8]:
data2 key
0 0 a
1 1 b
2 2 d
In [9]: pd.merge(df1,df2,on='key')
Out[9]:
data1 key data2
0 0 b 1
1 1 b 1
2 4 b 1
3 2 a 0
4 3 a 0
5 5 a 0
指明多个连接键
In [4]: df7=pd.DataFrame({
'key1':['b','b','a','a','b','a','c'],'key2':['i','j',