pandas的merge()函数

最新推荐文章于 2024-08-31 16:51:42 发布

fly_Xiaoma

最新推荐文章于 2024-08-31 16:51:42 发布

阅读量2.5k

点赞数 1

分类专栏： machineLearning Python

本文链接：https://blog.csdn.net/weixin_38664232/article/details/88866258

版权

Python 同时被 2 个专栏收录

66 篇文章 11 订阅

订阅专栏

machineLearning

33 篇文章 2 订阅

订阅专栏

merge需要依据共同的某一列或者某一行来进行合并

left: 左表（DataFrame）

right:右表（DataFrame）

how:连接方式

　　left: 仅保留左表的键

　　right: 仅保留右表的键

　　outer:两表的键取并集

　　inner:两表的键取交集

on:用来对齐的那一列的名字，用到这个参数的时候一定要保证左表和右表用来对齐的那一列都有相同的列名.

left_on :左侧DataFarme中用作连接键的列.
right_on:右侧DataFarme中用作连接键的列.

left_index : 将左侧的行索引用作其连接键 .
right_index :将右侧的行索引用作其连接键 .

sort :根据连接键对合并后的数据进行排序，默认为True.有时在处理大数据集时，禁用该选项可获得更好的性能.

suffixes :字符串值元组，用于追加到重叠列名的末尾，默认为（‘_x’,‘_y’）.例如，左右两个DataFrame对象都有‘data’，则结果中就会出现‘data_x’，‘data_y’.

copy :设置为False，可以在某些特殊情况下避免将数据复制到结果数据结构中.

1.1 复合key的合并方法

使用merge的时候可以选择多个key作为复合可以来对齐合并。

1.1.1 通过on指定数据合并对齐的列

In [41]: left = pd.DataFrame({'key1': ['K0', 'K0', 'K1', 'K2'],
   ....:                      'key2': ['K0', 'K1', 'K0', 'K1'],
   ....:                      'A': ['A0', 'A1', 'A2', 'A3'],
   ....:                      'B': ['B0', 'B1', 'B2', 'B3']})
   ....: 

In [42]: right = pd.DataFrame({'key1': ['K0', 'K1', 'K1', 'K2'],
   ....:                       'key2': ['K0', 'K0', 'K0', 'K0'],
   ....:                       'C': ['C0', 'C1', 'C2', 'C3'],
   ....:                       'D': ['D0', 'D1', 'D2', 'D3']})
   ....: 

In [43]: result = pd.merge(left, right, on=['key1', 'key2'])

这里写图片描述
没有指定how的话默认使用inner方法。

how的方法有：

left

只保留左表的所有数据

In [44]: result = pd.merge(left, right, how='left', on=['key1', 'key2'])

这里写图片描述

right

只保留右表的所有数据

In [45]: result = pd.merge(left, right, how='right', on=['key1', 'key2'])

这里写图片描述

outer

保留两个表的所有信息

In [46]: result = pd.merge(left, right, how='outer', on=['key1', 'key2'])

这里写图片描述

inner

只保留两个表中公共部分的信息

In [47]: result = pd.merge(left, right, how='inner', on=['key1', 'key2'])

这里写图片描述

1.2 indicator

v0.17.0 版本的pandas开始还支持一个indicator的参数，如果置True的时候，输出结果会增加一列 ’ _merge’。_merge列可以取三个值

left_only 只在左表中
right_only 只在右表中
both 两个表中都有

fly_Xiaoma

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录