Pandas pd.merge() 报错:ValueError: You are trying to merge on int64 and object columns.

1、需求:

df1  和 df2 按照 A, B 两列进行合并,假设 df1 为 A B C 三列,df2 为 A B D 三列,将其中A B 相同的列 merge 为 A B C D 四列。 

outfile = pd.merge(df1, df2, how='left', on=['A','B'])

2、用 pandas 合并两个 CSV 文件时,报错信息如下:

ValueError: You are trying to merge on int64 and object columns. If you wish to proceed you should use pd.concat

3、尝试解决:

虽然建议我用 pd.concat() ,但显然 concat() 函数只是简单拼接,并不符合我希望把两个表内 A B 两列值相同的行合并在一起的需求。

使用 dtype() 函数输出想merge 的A B 列的类型:

既然 A 列是 object 类型, B 列是 int64 类型,所以将 B 列转为 int 类型:

df['A'] = df['A'].apply(pd.to_numeric)

以上,问题解决~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值