pandas学习笔记—merge()函数详解

最新推荐文章于 2025-03-03 07:21:17 发布

ACE-Mayer

最新推荐文章于 2025-03-03 07:21:17 发布

阅读量5.7k

点赞数 9

分类专栏： Python 数据科学机器学习文章标签：数据挖掘机器学习 python

本文链接：https://blog.csdn.net/sunmingyang1987/article/details/106739469

版权

Python 同时被 3 个专栏收录

145 篇文章

订阅专栏

机器学习

112 篇文章

订阅专栏

数据科学

104 篇文章

订阅专栏

本文详细介绍了Pandas库中merge()函数的使用方法，包括其常用参数解释及多个实例演示，帮助读者掌握如何高效地对数据进行横向拼接操作。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1、merge()中的常用参数

pd.merge(left, right, how='inner', on=None, left_on=None, right_on=None,
         left_index=False, right_index=False, sort=True,
         suffixes=('_x', '_y'))

left: 拼接的左侧DataFrame对象
right: 拼接的右侧DataFrame对象
on: 指定两个dataframe按某一列进行连接，该列必须同时出现在两个dataframe中。
如果未传递且left_index和right_index为False，则DataFrame中的列的交集将被推断为连接键。
left_on:左侧DataFrame中用作连接键的列。可以是列名，索引级名称，也可以是长度等于DataFrame长度的数组。
right_on: 右侧DataFrame中用作连接键的列。可以是列名，索引级名称，也可以是长度等于DataFrame长度的数组。
left_index: 如果为True，则使用左侧DataFrame中的索引（行标签）作为其连接键的列。
对于具有MultiIndex（分层）的DataFrame，级别数必须与右侧DataFrame中的连接键数相匹配。
right_index: 与left_index功能相似。
how: ‘left’, ‘right’, ‘outer’或‘inner’之一。
默认inner。inner是取两个dataframe的连接键列中元素的交集，outer取其并集，如果其中一个dataframe中的连接键列中不含有某元素，则该元素对应的这行数据中的其它列用NAN填充。
sort: 按字典顺序通过连接键对结果DataFrame进行排序。默认为True，设置为False将在很多情况下显着提高性能。
suffixes: 用于重叠列的字符串后缀元组。默认为（‘x’，’ y’）。也可手动指定：suffixes=(“df1”,“df2”)

2、举例

列几个例子细细品味：

import pandas as pd
dataDf1=pd.DataFrame({'列1_left':['a','b','b','c'],
                     '列2_left':[1,2,2,3]})
dataDf2=pd.DataFrame({'列1_right':['b','c','c','d'],
                     '列2_right':[2,3,3,4]})
print(dataDf1)
print(dataDf2)

输出：
在这里插入图片描述

dataLfDf=pd.merge(dataDf1,dataDf2, left_on='列1_left',right_on='列1_right') #默认how='inner'
dataLfDf

在这里插入图片描述

dataLfDf=pd.merge(dataDf1,dataDf2, how='outer',left_on='列1_left',right_on='列1_right') 
dataLfDf

在这里插入图片描述

dataLfDf=pd.merge(dataDf1,dataDf2, how='right',left_on='列1_left',right_on='列1_right') 
dataLfDf

在这里插入图片描述

import pandas as pd
dataDf1=pd.DataFrame({'key':['a','b','b','c'],
                     '列2_left':[1,2,2,3]})
dataDf2=pd.DataFrame({'key':['b','c','c','d'],
                     '列2_right':[2,3,3,4]})
print(dataDf1)
print(dataDf2)

在这里插入图片描述

dataLfDf=pd.merge(dataDf1,dataDf2, how='outer',on='key') 
dataLfDf

在这里插入图片描述

dataLfDf=pd.merge(dataDf1,dataDf2, how='left',on='key') 
dataLfDf

在这里插入图片描述

pandas学习笔记—merge()函数详解

目录

1、merge()中的常用参数

2、举例