hdfs 多个文件合并_使用power query 快速合并多个excel文件

本文介绍了如何使用Power Query便捷地合并HDFS中的多个Excel文件,特别是当每个Excel文件包含多个工作簿时。通过创建新查询、选择需要的工作簿、自定义列并扩展数据,实现了数据的快速整合。这种方法对于频繁需要汇总分析大量数据的场景,相比VBA更为直观和易用。
摘要由CSDN通过智能技术生成

4be3eb90ce767b417190b2a6f542da01.png

在工作中会经常碰到数据被分成多个文件,每个文件里面又有多个表格,而且每月或每年都要进行汇总分析,如果数据量少的话就进行手工复制,实在太多的话只能使用vba,但vba熟练的人少且学习成本高,现在来看一看用power query怎么解决的?

acdf53f73899f27bd01162df9c10d2b0.png

如上图,里面有2017-2019年的销售数据,而且每个excel里面都有两个工作簿,分别为销量与金额。

新建一个excel文件,切换到数据选项,单击“新建查询”,选择“从文件”,选择“从文件夹”,选择等待合并的数据所在的文件夹,最后点击确定。如下图显示

9308b324bbb392809ba409610e26659a.png

87c60e6fc0670fd4263bb173a0adf409.png

这时,该文件内的所有文件都将被识别出来。由于每个文件里有不同的表,不能直接合并,因此在弹出的对话框中点击“转换数据”,进入power query编辑界面,如下图

57e58b3d344634b248d699ae0a39a8b8.png

在查询编辑器中可以看到该文件夹内的所有数据,工作簿的数据都在第一列Content,我们在第二列“name”选择所需要分析的工作簿“2017、2018、2019”

.

1f01b9abb77c1202786edb8e47a05c80.png

9f14b28b074b4ecb829076735c69df02.png

fe44230fc302437344cc8db9e8d476c0.png

在“添加列”选项卡,新建一个自定义列输入下面公式:=Excel.Workboo([content],true)。(在英文输入法下输入公式,并注意大小写)如下图:

d119c22027348c3e180199e55e335732.png

d358f79962bc322e7a6a37ec9ed09b13.png

展开后,在item列中选择金额,点确定,如下图:

f46e7f54d5ec97128bc77d0bfb798a23.png

在data列中,点扩展-展开-不勾选-确定

ca63508d8d5dd0cf95815bb02ddd37e4.png

最后我们得到如下图的数据,并在该数据中按住ctrl键选择相应的列,点击右键-删除其他列

6a147423d05534a6888635241848f50e.png

9e6049b7cd190fa40953447f23f000ae.png

接下来,在“name”列中-“转换”卡-提取-分隔符之前的文本,并输入“.”,如下图:

76da44af35c3217579d7ca77bf81c704.png

50f2bbfb7ca42f89e93d5b3e4e8d2e0c.png

最后我们就得到三个文件的中金额的三年汇总,如下图:

7971c55d074c7db7c206b358ed870092.png

我们把这查询改名为“金额”。

我们在左边的查询中,复制该查询,并改名为“销量”

e2b033a61c43551013dc59a24133acee.png

之前执行这个步骤,筛选了“金额”,点击右键-删除到末尾,重新进行筛选,在“item”中选择“销量”

e0cd5153056e015d559c8c7d3c081523.png

接下来的步骤按“金额”查询表进行操作,得到两张数据查询表分别是“金额”与“销量”,点击其中一个查询表-主页-合并查询-将查询合并为新查询(该操作相当于vlookup函数),如下图:

6c9d1388fe2afe7fdd7cd6e8f616795b.png

金额与销售查询表中,以“生产厂家省份”为进行查找比对(可以参照vlookup函数),在联接种类中选择“完全外部”,即“金额”与“销售”表中,都要在最终表选表中体现。在数据表中对“销售”列进行数据扩展-选择本期销售量-点击确定如下图:

84ce2150e164e16fe9ce86764c18cb3d.png

acd1672a540d6a5ee83c6d9ad6aba166.png

对上面的表格进行进一步的汇总,美化,“主页”选项卡-“分组依据”,按照下图进行按年、生产厂家省份对金额、销量进行汇总:

f249266d47c4b53e60714b78d0e1bc0e.png

将第一列的“name”修改为“年份”,并按照“年份”进行升序,如下图:

3ec566dfa9dd606c695d851700cfc497.png

点击“关闭并上载”,得到处理后的数据:

08eb366bfd5ff86aa33208de06a16165.png

如果就这样结束的话,就太对不起pq的自动化数据处理,在文件中新增2019-副本文如下图

b21fcae365f9fa3c78c5f6019d958001.png

我们只需分别在“金额”与“销量”查询表中,在第二个步骤“筛选的行”中,把“2019-副本”文件勾选即可-确定即可。如下图:

eb3f3766f5e13e7362669bd553f0cffa.png

“销售”查询表也是如上述步骤进行操作,关闭pq。最后在显示的数据表中右键-刷新即可如下图:

66d30d2ac0f1fe01feb4f652dc2da33d.png

dd85f95e04995c6a45dc06cce284c4eb.png

你看,数据是不是全部刷新了,而且新增了2019-副本的销售及金额数据。

虽然上述的步骤有点多,但是主要都是鼠标操作,比excel的公式及vba方便很多。

如果上述教程对你有帮助,请点个关注或有什么问题也可以留言,谢谢!!!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值