pandas merge on_Pandas数据处理——一文详解数据拼接方法merge

最新推荐文章于 2023-11-07 00:00:00 发布

weixin_39857876

最新推荐文章于 2023-11-07 00:00:00 发布

阅读量1.2k

点赞数

点击上方“Python读数”，选择“星标”公众号

重磅干货，第一时间送达

为了方便维护，一般公司的数据在数据库内都是分表存储的，比如用一个表存储所有用户的基本信息，一个表存储用户的消费情况。所以，在日常的数据处理中，经常需要将两张表拼接起来使用，这样的操作对应到SQL中是join，在Pandas中则是用merge来实现。这篇文章就讲一下merge的主要原理。

上面的引入部分说到merge是用来拼接两张表的，那么拼接时自然就需要将用户信息一一对应地进行拼接，所以进行拼接的两张表需要有一个共同的识别用户的键(key)。总结来说，整个merge的过程就是将信息一一对应匹配的过程，下面介绍merge的四种类型，分别为'inner'、'left'、'right'和'outer'。

inner

merge的'inner'的类型称为内连接，它在拼接的过程中会取两张表的键(key)的交集进行拼接。什么意思呢？下面以图解的方式来一步一步拆解。

首先我们有以下的数据，左侧和右侧的数据分别代表了用户的基础信息和消费信息，连接两张表的键是userid。

现在用'inner'的方式进行merge

In [6]: df_1.merge(df_2,how='inner',on='userid')Out[6]:  userid  age  payment0      a   23     20001      c   32     3500

过程图解：

①取两张表的键的交集，这里df_1和df_2的userid的交集是{a,c}

最低0.47元/天解锁文章

weixin_39857876

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
pandas merge on_Pandas数据处理——一文详解数据拼接方法merge

点击上方“Python读数”，选择“星标”公众号重磅干货，第一时间送达为了方便维护，一般公司的数据在数据库内都是分表存储的，比如用一个表存储所有用户的基本信息，一个表存储用户的消费情况。所以，在日常的数据处理中，经常需要将两张表拼接起来使用，这样的操作对应到SQL中是join，在Pandas中则是用merge来实现。这篇文章就讲一下merge的主要原理。上面的引入部分说到merge是用来...
复制链接

扫一扫

pandas merge on_Pandas数据处理——一文详解数据拼接方法merge

inner

“相关推荐”对你有帮助么？