使用pandas的merge方法进行数据合并的时候,如果列名相同则可以省去列名的指定,pandas会进行自动的识别。但是如果两组数据的列名不一致,不加任何参数直接进行默认的操作则会导致报错。
例如有如下两组数据:
In [40]:df1
Out[40]:
data1 key1:
0 0 c
1 1 d
2 2 e
3 3 f
4 4 g
5 5 a
6 6 b
In [41]:df2
Out[41]:
data2 key2
0 0 a
1 1 c
2 2 d
尝试进行数据合并,结果提示如下:
In [42]:pd.merge(df1,df2)
---------------------------------------------------------------------------
MergeError Traceback (most recent call last)
in()
----> 1pd.merge(df1,df2)
/Library/Python/2.7/site-packages/pandas/tools/merge.pyc inmerge(left, right, how, on, left_on, right_on, left_index, right_index, sort, suffixes, copy, indica