Python每日一记195>>>merge函数使用中笛卡尔积问题（一对多，多对一，一对一，多对多）

最新推荐文章于 2023-03-21 18:16:19 发布

教练我想学编程

最新推荐文章于 2023-03-21 18:16:19 发布

阅读量2.9k

点赞数 5

本文链接：https://blog.csdn.net/weixin_44663675/article/details/103574621

版权

不了解笛卡尔积没有关系，这里主要说明以下merge函数的一对多，多对一，一对一，多对多问题，注意这里主要指的是连接键的对应关系。
注意这里所有的代码都使用以下方式：
也就是采用左连接的方式，左边取全部，右边取部分，注意这里的左边取全部表示的是左边取全部的行，针对行而言的。
另外还有right(右边取全部的行)，inner(取两者共同的行)，outer(取两者行的并集)，如果某一行没有某个字段，就填充NaN。

import pandas as pd
import numpy as np
data1=pd.read_excel(r'C:\Users\17621802479\Desktop\测试.xlsx',sheet_name='姓名')
data2=pd.read_excel(r'C:\Users\17621802479\Desktop\测试.xlsx',sheet_name='年龄')
data_hb=pd.merge(data1,data2,on='学号',how='left')
print(data_hb)

一对一

原始数据如下：
在这里插入图片描述

合并后数据为：

我们发现连接键为学号，两者的学号都是唯一的，故直接合并，没有的用NaN填充。

多对一

原始数据如下：
在这里插入图片描述

合并后数据为：

我们发现连接键为学号，data1中的学号有两个1，但是因为data2中的学号是唯一的，因此也是按照常规方式合并。

一对多

原始数据如下：
在这里插入图片描述

合并后数据为：

我们发现连接键为学号，data1中的学号有一个1，但是因为data2中的学号有两个1的，因此合并后的数据，就出现了两个1，原因就是data2中的学号1有两个，可以这样理解，你data1中有一个1，data2中有两个1，你让data1去选择哪个1合并，选哪个都不好，只有两个都选了。

多对多

原始数据如下：
在这里插入图片描述

合并后数据为：
![在这里插入图片描述](https://img-blog.csdnimg.cn/20191217100422358.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80NDY2MzY3NQ==,size_16,color_FFFFFF,t_7

我们发现连接键为学号，data1中的学号有两个1，但是data2中的学号也有两个1，因此合并后的数据，就出现了四个1，这就出现了典型的笛卡尔积的问题。

好了最后再强调一点：一对多，多对一，一对一，多对多针对的是键的内容的对应关系。不是针对其他列的，比如对于下面的一对多：
在这里插入图片描述

我们发现data2的学号1对应的年龄都是10，如果错误的理解一对多，多对一，一对一，多对多针对的对应关系不是键的内容的对应关系。可能会认为结果应该是只有一个学号1，但是我们根据的是键的对应，因此还是出现了两个学号1，即使年龄都是10。

教练我想学编程

关注

5
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
Python每日一记195>>>merge函数使用中笛卡尔积问题（一对多，多对一，一对一，多对多）

不了解笛卡尔积没有关系，这里主要说明以下merge函数的一对多，多对一，一对一，多对一问题，注意这里主要指的是连接键的对应关系。注意这里所有的代码都使用以下方式：也就是采用左连接的方式，左边取全部，右边取部分，注意这里的左边取全部表示的是左边取全部的行，针对行而言的。另外还有right(右边取全部的行)，inner(取两者共同的行)，outer(取两者行的并集)，如果某一行没有某个字段，就填...
复制链接

扫一扫