回顾
在数据处理进阶pandas入门(十一)中,我们介绍了pandas中的一些简单常见的数值计算和统计相关方法,这些方法都是在使用pandas处理数据时会经常用到的方法。今天我们看一下另一个数据处理的重要功能——pandas中的合并功能。
pandas具有全功能、高性能的在内存中进行连接操作的特性,这与SQL等关系型数据库非常相似。pandas中主要使用merge()和join()这两个方法来合并数据。
merge()方法
pandas具有全功能、高性能的在内存中进行连接操作的特性,这与SQL等关系型数据库非常相似。pandas中主要使用merge()和join()这两个方法来合并数据。
merge()方法接收要合并的两个DataFrame数据,并指明合并参考键。基本用法如下。
import pandas as pdimport numpy as npdf1 = pd.DataFrame({'key':['key0','key1','key2','key3'], 'A':['a0','a1','a2','a3'], 'B':['b0','b1','b2','b3']})df2 = pd.DataFrame({'key':['key0','key1','key2','key3'], 'C':['c0','c1','c2','c3'], 'D':['d0','d1','d2','d3']})print(df1)print("---------------")print(df2)print("---------------")# on参数表示合并参考键print(pd.merge(df1, df2, on='key'))
以上代码中的两个DataFrame数据中有个相同的键key,我们可以把它作为参考键,合并时只需要将两个DataFrame传入merge()方法,并将on参数指定两个DataFrame的共同键即可。运行结果如下图所示。
![8f4f730bc92f4db1a9cd2b441dc5736c.png](https://img-blog.csdnimg.cn/img_convert/8f4f730bc92f4db1a9cd2b441dc5736c.png)
merge()方法基本用法
当DataFrame中有两个可以作为参考键的键时,我们可