pandas.DataFrame.merge() on列 存在重复值

pandas.DataFrame.merge() on列 存在重复值

问题描述

使用pa.merge()函数合并两个表,on= 参数指定连接主键时,主键内存在重复值。
如下两个表,state都存在重复值。

在这里插入图片描述

结果

!!!注意:使用pa.merge()函数合并两个表后,重复主键会产生笛卡尔积。  

在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
pandas.concat是pandas库中一个用于连接(合并)多个数据框(DataFrame)的函数。它可以沿着指定的轴(默认为行轴)将多个数据框连接在一起,形成一个新的数据框。这个函数可以实现多种连接方式,包括按行或按连接,连接时可以指定连接方式(内连接、外连接等)以及对缺失的处理方式。pandas.concat的语法如下: ```python pandas.concat(objs, axis=0, join='outer', ignore_index=False) ``` 其中,objs是要连接的多个数据框(DataFrame)的表或字典;axis是指定连接的轴,默认为行轴(axis=0);join是指定连接方式,默认为外连接(join='outer');ignore_index是是否忽略原始索引,默认为False。 pandas.join是pandas库中用于按照索引连接多个数据框的方法。它可以根据索引将多个数据框连接在一起,形成一个新的数据框。和pandas.concat不同,pandas.join只能按照索引进行连接,无法指定其他连接方式。pandas.join的语法如下: ```python DataFrame.join(other, on=None, how='left', lsuffix='', rsuffix='', sort=False) ``` 其中,DataFrame是要连接的数据框;other是要连接的其他数据框;on是指定连接的名或表,默认为None使用索引进行连接;how是指定连接方式,默认为左连接(how='left');lsuffix和rsuffix是指定用于重叠的后缀,默认为空字符串;sort是指定是否根据连接键排序,默认为False。 pandas.mergepandas库中一个类似于SQL的内连接操作,用于按照进行连接多个数据框。它可以根据指定的将多个数据框连接在一起,形成一个新的数据框。pandas.merge的语法如下: ```python pandas.merge(left, right, on=None, how='inner', sort=False) ``` 其中,left和right是要连接的两个数据框;on是指定连接的名或表,默认为None自动寻找重叠进行连接;how是指定连接方式,默认为内连接(how='inner');sort是指定是否根据连接键排序,默认为False。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值