python merge on多个条件_Python数据核对系列之2—power query VS pandas

这篇博客介绍了如何在Excel Power Query和Python的Pandas库中进行两表数据合并与核对。文章详细阐述了Power Query的合并查询功能,包括合并设置、连接种类和数据展开。同时,对比了Pandas的merge方法,讲解了DataFrame的连接方式、参数含义,并给出了一行代码实现两表比对的例子。
摘要由CSDN通过智能技术生成
提示:本文略长,干货满满上一篇文章我们整体梳理了我核对两个表数据,从excel query模式一版版过渡到python多线程多进程读取数据库数据后完成核对并输出结果到数据库表中的整个版本迭代过程。从本篇开始,我们挨个梳理讲解下,在整个过程中我的实际操作,遇到的各种坑,以及找到的解决方案。

Excel power query两表核对

66e6496a89b28a1687e23e9b20901ff6.png

利用query进行核对使用的是query里面的合并查询,其实也就是sql当中的左连接、右连接、全外连接。可以通过设定的连接字段来完成两表的合并。我们从数据-新建查询-从文件里选择从工作簿或者从csv。然后加载我们的源文件。

3ce2a860af6536f97231fc4ed26d6e3a.png

在选择csv文件加载的时候,有时候会因为原始数据的某个字段里包含换行符而导致加载完的数据会出现错行问题,导致你的数据格式设置会报错。这个问题的解决方案我们之前已经发过了,大家再遇到的话可以再查看一下。power query加载csv错行?

原始数据加载完后,我们选择query的主页里的组合中的合并查询

85233668ff28aee8e5039dad793e4c52.png

合并查询里有个合并查询、将查询合并为新查询

9f1cc498f678a550b9f43a412446ffac.png

点击合并查询后,弹出合并设置窗口,选择两个原始表的查询,并点选连接字段。

f2e438a33ca24dd91f207699457d1f85.png

如果是多个连接字段的话,需要按住ctrl点击字段,效果会如下图所示

1a25557399d2c82b38646a3b0f288463.png

选择完连接的字段之后,我们需要设置他们的连接种类。共有6种连接设置。上面的解释也很清楚明白。

1d88735faa8ed46a5ebb59803f806b2f.png

选择连接方式之后,它会显示连接的匹配行数。

861d836b2aed6c05f1b6f8aa5296850e.png

两表连接完成之后,关联的数据会存储在一新的列里

78303e17f56d41fd53d36af469278136.png

点击这个table,它会显示跟当前数据关联的数据明细

如果关联的数据有多条如下图所示

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值