提示:本文略长,干货满满上一篇文章我们整体梳理了我核对两个表数据,从excel query模式一版版过渡到python多线程多进程读取数据库数据后完成核对并输出结果到数据库表中的整个版本迭代过程。从本篇开始,我们挨个梳理讲解下,在整个过程中我的实际操作,遇到的各种坑,以及找到的解决方案。
Excel power query两表核对
利用query进行核对使用的是query里面的合并查询,其实也就是sql当中的左连接、右连接、全外连接。可以通过设定的连接字段来完成两表的合并。我们从数据-新建查询-从文件里选择从工作簿或者从csv。然后加载我们的源文件。 在选择csv文件加载的时候,有时候会因为原始数据的某个字段里包含换行符而导致加载完的数据会出现错行问题,导致你的数据格式设置会报错。这个问题的解决方案我们之前已经发过了,大家再遇到的话可以再查看一下。power query加载csv错行?原始数据加载完后,我们选择query的主页里的组合中的合并查询
合并查询里有个合并查询、将查询合并为新查询
点击合并查询后,弹出合并设置窗口,选择两个原始表的查询,并点选连接字段。
如果是多个连接字段的话,需要按住ctrl点击字段,效果会如下图所示选择完连接的字段之后,我们需要设置他们的连接种类。共有6种连接设置。上面的解释也很清楚明白。
选择连接方式之后,它会显示连接的匹配行数。
两表连接完成之后,关联的数据会存储在一新的列里
点击这个table,它会显示跟当前数据关联的数据明细
如果关联的数据有多条如下图所示