同时导入多个文件中的数据
在上一节中,我们通过一个“数据导入过程”获取了两家商店的库存数据:Sample1和Sample2。如果这两家商店是同一公司下的分店,我们就有必要将两个文件中的数据放在一起分析。Power Query当然可以完成这个任务,但应首先保证这两个文件被放置在了同一文件夹中。
这次我们在启动Power Query时选择“从文件夹”而非之前的“从工作簿”:
浏览并找到存放数据文件的文件夹:
稍等片刻,我们连接到了目标文件夹,但请注意这个地方没有导航器,只有一个预览窗格,预览内容似乎是文件夹中的文件名、修改时间、路径等信息。别想这么多,还是先“转换数据”吧:
完成数据转换后,Power Query编辑器中出现的还是文件名、修改时间、路径等信息,而不是我们想要的具体库存数据……
思考一下,商店库存里面的钢笔、墨水可以组成数据,文件夹里的文件怎么就不能组成数据了?正如之前的例子,一行数据代表了一种商品,这里的每一行都代表了一个文件。
请注意其中有一列叫做“Content”,它不是常见的数字、文件或日期,它具有一种特殊的数据类型:“二进制”。在这里我们把“二进制”理解为计算机中的一个文件,这个列的单元格里面装的就是Excel文件本身!
点击该列中的任意一个单元格,可以在预览区域看到它确实就是一个Excel文件。
看来我们要扩展我们的认知范围了: