pandas取两个dataframe中不同的行

pandas提供的可直接使用的函数(merge/join/concat)没有这个功能, 所以要实现这个功能, 需要自己来实现, 也有参考过别的网友自己的处理逻辑, 感觉都比较繁琐, 步骤太多, 从这篇知乎上找到这个骚操作,方法可行,两行代码搞定, 自己在此搬运记录一下

def anti_join(x, y, on):
    """
    :param x:
    :param y:
    :param on:如没有特殊需求,可以不要这个参数
    :return: 返回x中不包含y的部分
    """
    ans = pd.merge(left=x, right=y, how='left', indicator=True, on=on)
    ans = ans.loc[ans._merge == 'left_only', :].drop(columns='_merge')
    return ans
  • 4
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 要将两个DataFrame合并(即按连接),可以使用pandas的concat()函数。下面是使用concat()函数按合并两个DataFrame的示例代码: ``` python import pandas as pd # 创建两个DataFrame df1 = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]}) df2 = pd.DataFrame({'A': [7, 8, 9], 'B': [10, 11, 12]}) # 将两个DataFrame合并 result = pd.concat([df1, df2]) print(result) ``` 上述代码,首先通过pd.DataFrame()函数创建了两个DataFrame,然后使用pd.concat()函数将这两个DataFrame合并,并将结果存储在result变量。最后,将结果打印出来。 输出结果如下: ``` A B 0 1 4 1 2 5 2 3 6 0 7 10 1 8 11 2 9 12 ``` 在合并后的结果索引是连续的整数,这是由于原始DataFrame索引也是连续的整数。如果要重新设置索引,可以使用reset_index()函数,如下所示: ``` python result = pd.concat([df1, df2]).reset_index(drop=True) print(result) ``` 在reset_index()函数,参数drop=True表示删除原始的索引,使用默认的连续整数作为新的索引。 输出结果如下: ``` A B 0 1 4 1 2 5 2 3 6 3 7 10 4 8 11 5 9 12 ``` ### 回答2: Pandas是一个强大的数据处理工具,可以用它来合并两个DataFrame,按合并的方法有多种。 一种常见的方法是使用concat函数,可以将两个DataFrame合并为一个新的DataFrame。具体操作可以按照以下步骤进: 1. 首先,通过import语句导入pandas库,并创建两个要合并的DataFrame,假设分别为df1和df2。 2. 使用concat函数,将df2合并到df1的下方,设置参数axis=0表示按合并。合并后的新DataFrame可以赋值给一个新的变量,比如df3。 3. 最后,可以使用print函数输出合并后的df3,查看结果。 下面是具体的示例代码: ``` import pandas as pd # 创建两个DataFrame df1 = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]}) df2 = pd.DataFrame({'A': [7, 8, 9], 'B': [10, 11, 12]}) # 合并两个DataFrame df3 = pd.concat([df1, df2], axis=0) # 输出合并后的DataFrame print(df3) ``` 上述代码,df1是一个包含两列数据的DataFrame,df2也是一个包含两列数据的DataFrame。通过concat函数将两个DataFrame合并为df3,并且按照顺序保留原来的顺序。 希望以上解答对您有帮助,如有任何疑问,请随时追问。 ### 回答3: Pandas是一个强大的数据分析工具,可以用于处理和操作数据。在Pandas,可以使用concat()函数将两个DataFrame合并。 下面是一个用于合并两个DataFrame的示例代码: ```python import pandas as pd # 创建两个DataFrame df1 = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]}) df2 = pd.DataFrame({'A': [7, 8, 9], 'B': [10, 11, 12]}) # 合并两个DataFrame df = pd.concat([df1, df2], axis=0, ignore_index=True) print(df) ``` 在上面的代码,首先导入pandas库,并创建了两个DataFrame(df1和df2)。然后,使用concat()函数将这两个DataFrame合并为一个新的DataFrame(df),并将结果存储在df变量。concat()函数可以指定axis参数为0,表示按合并;ignore_index参数为True,表示重新索引合并的结果。 最后,使用print()函数打印合并后的DataFrame(df)。 执上述代码,输出结果如下: ``` A B 0 1 4 1 2 5 2 3 6 3 7 10 4 8 11 5 9 12 ``` 可以看到,合并后的DataFrame按照原有的顺序进了合并,并且重新索引了结果的号。 以上就是使用Pandas合并两个DataFrame的方法。希望对你有帮助!

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值