本节概述
Power Query负责数据分析中的第一步,即将外部的数据导入Power BI,对其进行清洗、整合,使之更加规范、适于进行分析。
该工具可以完成我们日常在excel中常用的数据拼接、格式变更、筛选过滤、查找替换、分列、条件分组、空值填充等多种操作,并且可以将执行过的操作步骤记录下来,在原始数据有更新时,自动将清洗步骤重新应用于刷新后的数据,完成数据处理。
关于案例数据
我们从 世界银行 Indicators | Data 下载了如下四项指标:0-14岁的人口(占总人口的百分比)、15-64岁的人口(占总人口的百分比)、65岁和65岁以上的人口(占总人口的百分比)、人口总数。
因为这些数据不涉及更新,为了本地文件管理方便,我将这四个数据表合并在了同一个excel中,实际操作中使用独立的文件也完全没有问题、甚至是更加灵活。因为不论是一个excel中的多个工作表、还是独立的多个excel文件,在导入后都是每张工作表形成一个数据源,在数据源数量上没有区别,按照个人使用习惯即可。
如下图所示,这些指标数据都拥有相同的结构,即数据主体从单元格A4开始,包括Country