1、需求:
df1 和 df2 按照 A, B 两列进行合并,假设 df1 为 A B C 三列,df2 为 A B D 三列,将其中A B 相同的列 merge 为 A B C D 四列。
outfile = pd.merge(df1, df2, how='left', on=['A','B'])
2、用 pandas 合并两个 CSV 文件时,报错信息如下:
ValueError: You are trying to merge on int64 and object columns. If you wish to proceed you should use pd.concat
3、尝试解决:
虽然建议我用 pd.concat() ,但显然 concat() 函数只是简单拼接,并不符合我希望把两个表内 A B 两列值相同的行合并在一起的需求。
使用 dtype() 函数输出想merge 的A B 列的类型:
既然 A 列是 object 类型, B 列是 int64 类型,所以将 B 列转为 int 类型:
df['A'] = df['A'].apply(pd.to_numeric)
以上,问题解决~