【python】———merge函数

最新推荐文章于 2024-05-15 09:22:04 发布

朵朵zeng

最新推荐文章于 2024-05-15 09:22:04 发布

阅读量1.9w

点赞数 13

分类专栏： Python学习文章标签： python 开发语言

本文链接：https://blog.csdn.net/qq_40264559/article/details/124501811

版权

9 篇文章 5 订阅

订阅专栏

本文详细介绍了使用Pandas库的merge函数进行数据合并时，如何处理右表重复值的问题。通过实例展示了当右表无重复项时，左右匹配的结果保持原左表行数；而当右表存在重复项时，未去重会导致左表行数增加。为确保匹配准确性，通常需要先对右表进行去重处理。最后，总结了在数据匹配中对右表去重的重要性。

摘要由CSDN通过智能技术生成

@爱学习的DUO

import pandas as pd
A = pd.read_excel('D:/pp/test.xlsx','Sheet1');A
B = pd.read_excel('D:/pp/test.xlsx','Sheet2');B

在这里插入图片描述

例1：有A(5行)、B（10行）两个表，按ID和key进行横向匹配。
（1）首先把B表的列名字【key】改为【ID】，以便于后续匹配。

B=B.rename(columns={'key':'ID'});B

（2）用B表去匹配A表（参数=‘left’）。

AB=pd.merge(A,B,on = ['ID'],how='left');AB

BA=pd.merge(B,A,on = ['ID'],how='left');BA

C = pd.read_excel('D:/pp/test.xlsx','Sheet3');C

AC=pd.merge(A,C,on = ['ID'],how='left');AC

（1）对C表的ID去重，重命名为C_qc

C_qc=C.drop_duplicates(['ID'])
C_qc

AC1=pd.merge(A,C_qc,on = ['ID'],how='left');AC1

可以看出，使用merge函数的时候，如果右表有重复值，会导致结果的不准确。所以一般对右表做去重处理，再与左表进行横向匹配。

关注

专栏目录