数据合并之concat、append、merge和join

最新推荐文章于 2022-05-14 15:18:33 发布

小詹学 Python

最新推荐文章于 2022-05-14 15:18:33 发布

阅读量2.2k

点赞数 1

文章标签：数据库 python java 数据分析大数据

原文链接：https://mp.weixin.qq.com/s?__biz=MzU0OTU5OTI4MA==&mid=2247502325&idx=2&sn=d1c78b6f066cf6add989c5d0af5c4d1c&chksm=fbafe8aaccd861bc4e8737bcfc5d0c518af1696d64c6905ba7d0e104f02d14198924b1a53cd4&scene=126&&sessionid=0

版权

Pandas 是一套用于 Python 的快速、高效的数据分析工具。它可以用于数据挖掘和数据分析，同时也提供数据清洗功能。本文将详细讲解数据合并与连接，目录如下：

①

concat

一.定义

concat函数可以在两个维度上对数据进行拼接，默认纵向拼接（axis=0），即按行拼接。拼接方式默认为外连接（outer)，即取所有的表头字段或索引字段。

二.语法

pd.concat(objs,axis=0, join='outer', ignore_index=False,

keys=None,levels=None, names=None, verify_integrity=False,

copy=True)

参数释义：

objs：需要用于连接合并的对象列表

axis：连接的方向，默认为0（按行），按列为1

join：连接的方式，默认为outer，可选inner只取交集

ignore_index：合并后的数据索引重置，默认为False，可选True

keys：列表或数组，也可以是元组的数组，用来构造层次结构索引

levels：指定用于层次化索引各级别上的索引，在有keys值时

names：用于创建分层级别名称，在有keys和levels时

verify_integrity：检查连接对象中新轴是否重复，若是则异常，默认为False允许重复

copy：默认为True，如果是False，则不会复制不必要的可以提高效率

三.代码示例

首先，我们看一个简单的例子：

以上代码构建了3个字典并转为DataFrame，然后通过concat实现默认方式合并。合并演示如下：

1.设置参数keys

2.设置axis参数

axis=1按列合并，默认情况下，join='outer'，合并时索引全部保留，对于不存在值的部分会默认赋NaN。

3.设置join参数

4.设置ignore_index参数

5.Series与DataFrame合并

②

append

一.定义

运用append方法，可以将Series或字典数据添加到DataFrame。

二.代码示例

③

merge

一.定义

merge函数可根据一个或多个键（列）相同进行DataFrame拼接。类似于关系型数据库的join操作。

二.语法

pd.merge(left, right, how='inner', on=None, left_on=None,

right_on=None,left_index=False,right_index=False, sort=True,

suffixes=('_x', '_y'), copy=True, indicator=False,validate=None)

参数释义：

left：参与合并的左侧数据

right：参与合并的右侧数据

how：合并类型：inner(默认内连接)、outer（外连接）、left（左连接）、right（右连接）

on：用于连接的列名，默认为左右侧数据共有的列名，指定时需要为左右侧数据都存在的列名

left_on：左侧数据用于连接的列

right_on：右侧数据用于连接的列

left_index：将左侧索引作为连接的列

right_index：将右侧索引作为连接的列

sort：排序，默认为True，设置为False可提高性能

suffixes：默认为('_x', '_y')，可以自定义如('date_x','date_y')

copy：默认为True，如果是False，则不会复制不必要的可以提高效率

indicator：指示器，默认False，设置为True时会新增一列标识

validate：字符串，如果指定则会检测合并的数据是否满足指定类型（1对1，1对多，多对1，多对多）

三.示例

首先，我们看一个简单的例子：

1.设置参数how

2.设置validate参数

3.设置indicator参数

4.设置left_on参数和right_on参数

④

join

一.定义

join可以将两个没用共同列名的数据进行快速合并，默认是保留被合并的数据索引。join接受的参数有how、on和suffix等。

二.示例

E N D

各位伙伴们好，詹帅本帅搭建了一个个人博客和小程序，汇集各种干货和资源，也方便大家阅读，感兴趣的小伙伴请移步小程序体验一下哦！（欢迎提建议）

推荐阅读

牛逼！Python常用数据类型的基本操作（长文系列第①篇）

牛逼！Python的判断、循环和各种表达式（长文系列第②篇）

牛逼！Python函数和文件操作（长文系列第③篇）

牛逼！Python错误、异常和模块（长文系列第④篇）

小詹学 Python

关注

1
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
数据合并之concat、append、merge和join

Pandas 是一套用于 Python 的快速、高效的数据分析工具。它可以用于数据挖掘和数据分析，同时也提供数据清洗功能。本文将详细讲解数据合并与连接，目录如下：①concat一.定义co...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。