【编程学习整理】12：python之数据分析常用操作

最新推荐文章于 2024-07-15 12:58:02 发布

qa231871

最新推荐文章于 2024-07-15 12:58:02 发布

阅读量585

点赞数 2

分类专栏：编程学习整理文章标签： python 数据分析人工智能

本文链接：https://blog.csdn.net/qa231871/article/details/116334192

版权

本文详细介绍了Python数据分析中pd.merge()函数的使用，包括如何通过指定参数进行数据合并，如on、left_on、right_on等。通过实例解析了内连接、外连接、左连接和右连接的区别，并展示了如何处理两个数据集中存在相同列名的情况。

摘要由CSDN通过智能技术生成

在合并数据的操作中，除了pd.concat()函数，另一个常用的函数就是pd.merge()了，这两个函数也经常被拿来比较，其实只要弄懂了函数中重要参数的作用理解了每个函数的用法，自然就知道在哪种情况下使用哪一个函数，需要对函数中的哪个参数进行怎样的设置了。好了，让我们步入正题来认识一下pd.merge()函数吧！

pd.merge()函数介绍
在函数的官方文档里就有写到pd.merge()的作用是用数据库样式的连接合并DataFrame或者已命名的Series。现在我们一起看一下这个函数的庐山真面目吧：

pd.merge( left, right, how=‘inner’, on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=False, suffixes=(’_x’, ‘_y’), copy=True, indicator=False, validate=None,)

以上是pd.merge()函数的所有参数，下边我们通过例子对常用参数进行讲解。

参数left和right
和pd.concat()不同，pd.merge()只能用于两个表的拼接，而且通过参数名称也能看出连接方向是左右拼接，一个左表一个右表，而且参数中没有指定拼接轴的参数，所以pd.merge()不能用于表的上下拼接。

如果需要拼接的两个表中，有相同的列信息，那么进行拼接的时候即使不指定以哪个字段作为主键函数也会默认用信息相同的列做主键对两个表进行拼接，如下例：

假设这是来自人力部门对员工信息的统计表：