<Excel> 数据分析之用Power Query实现数据转换和清洗(功能操作篇)

11 篇文章 9 订阅
3 篇文章 1 订阅

一个案例快速了解Power Query

凭借 Power Query,可以搜索数据源,创建连接,然后按照可满足你需求的方式调整数据(例如删除列、更改数据类型或合并表格)以创建报表。
例:将门店一&门店二两个工作簿的数据整合到一张工作表,并统计出各销售代表每个月的业绩

了解案例.gif-2849.3kB

数据的行列管理及删除重复项

如下例所示:

PQ行列管理.gif-2942.2kB

数据格式的转换及删除错误

如下例所示,更改表格中标注黄色的异常单元格

PQ格式转换及删除错误.gif-3482.4kB

*注意事项
1.大小写:Power Query对英文字母的大小写十分敏感,不能用大写字母去找小写字母,反之一样
2.修整:在所选列的每个单元格中删除前导空格和尾随空格
使用“修整”功能时需注意,尽量不要对整张表格进行一次性修整,由于数据格式不同,容易出现报错(文本格式下要)
3.清除:清除所选列中的非输入字符(例如:回车)
4.添加前缀/后缀:在所选列单元格的前/后增加指定的字符,类似于合并

数据格式的拆分、合并和提取操作演示

PQ数据合并拆分和提取.gif-3431.3kB

转置和反转

转置:行列数据互转

PQ转置.gif-883.2kB

反转行:第一行数据和最后一行数据的互换

PQ反转行.gif-539.7kB

透视和逆透视(二维和一维的转换)

一维指仅有列标题的数据,二维指既有行标题又有列标题的数据
透视:一维转二维
选中的列透视后会以行数据的形式出现

PQ透视.gif-204.7kB

逆透视:二维转一维

PQ逆透视.gif-188.5kB

分组依据和添加列

如下例所示:
求出每个班组的人数,平均年龄,居住外地人数,大学生人数,平均满意度

PQ分组依据和添加列.gif-4127.7kB

“添加列”功能下“自定义列”说明:

image_1cqnatmr5b6d134f12u44qh16a2q.png-42.7kB

日期和时间的整理功能说明

如下图所示:

日期.png-122.5kB

时间.png-100.6kB

持续时间:通过年限来提取

持续时间.png-99.8kB

数学运算功能说明

如下图所示:

计算.png-137.4kB

追加查询

用途:追加多份数据到一份数据中查询,对表格的纵向追加
要求多份数据的列标题名称一致(导出的数据以第一份数据的格式为准)

1.追加同一工作表的两份数据到一份数据
如下例所示:

PQ追加.gif-4571.1kB

若列标题不一致,追加查询后导出的数据会新增一列不同名称的列数据
如下例所示:

PQ追加-列名称不同.gif-1239.4kB


或者修改数据后重新导入两份数据

2.追加一个工作簿中多工作表的数据到一个工作表
如下例所示:

PQ追加-多工作表.gif-12800kB

3.追加一个文件夹内多工作簿的数据到一个工作表
如下例所示:

PQ追加-多工作簿.gif-7464.1kB

*需要运用Power Query的M函数之一
=Excel.Workbook(目标)
作用:将Binary列内容转换为Table列

4.追加一个文件夹内多CSV文件到一个工作表

PQ追加-多CSV.gif-4446.5kB

*也可用以下简便方法追加多工作簿/多CSV文件
如下例所示:

PQ追加-简便方法.gif-3624.6kB

合并查询

通过多张数据共有的字段,将其他源数据的内容添加到一张工作表
是对表格的横向合并,类似于Excel的Vlookup函数
如下例所示:
将sheet1中三组数据合并,计算出各客户不同产品的折扣金额

PQ合并.gif-4267.7kB

合并查询里的联接种类

联接种类-1.png-65.8kB

案例之中国式排名

中国式排名.gif-2883.4kB

案例之分组中国式排名

分组中国式排名.gif-4126kB

案例之生成笛卡尔积表

笛卡尔积表.gif-3245.6kB

案例之多行属性合并

多行属性合并.gif-3491.7kB

  • 18
    点赞
  • 104
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
好的,以下是一个练习,我们将使用 Power BI 对一个示例数据集进行数据集成、数据清洗数据转换数据规约操作。 1. 数据集成:将多个数据源合并为一个数据集。 我们将使用两个数据源: - 一个 Excel 文件,包含订单信息,如订单号、订单日期、订单总额等。 - 一个 CSV 文件,包含客户信息,如客户编号、客户名称、客户地址等。 将两个数据源合并为一个数据集,可以按照以下步骤进行: - 点击 "获取数据" 菜单,选择 "Excel",打开订单信息 Excel 文件。 - 选择需要导入的数据表,并指定导入方式(如 Table、PivotTable 或 Connection)。 - 选择 "获取数据" 菜单,选择 "文本/CSV",打开客户信息 CSV 文件。 - 指定 CSV 文件的分隔符、字符编码、列类型等信息,并导入数据。 - 在 Power Query 编辑器中,使用 "合并查询" 功能将两个数据源合并为一个数据集,根据订单号和客户编号进行关联。 2. 数据清洗:删除重复数据、填充空值、删除异常值等。 我们可以按照以下步骤进行数据清洗: - 在 Power Query 编辑器中,使用 "删除重复值" 功能删除重复数据。 - 使用 "填充" 功能填充空值,例如将客户地址为空的记录填充为 "未知地址"。 - 使用 "筛选" 功能删除异常值,例如将订单总额为负数的记录删除。 3. 数据转换:将数据类型转换为正确的类型、提取需要的信息等。 我们可以按照以下步骤进行数据转换: - 在 Power Query 编辑器中,使用 "更改类型" 功能数据类型转换为正确的类型,例如将订单日期转换为日期类型。 - 使用 "分割列" 功能提取需要的信息,例如将客户地址分为省份、城市和街道三个字段。 4. 数据规约:将数据聚合为更高层次的信息,例如按照时间、地区、产品等维度对数据进行聚合分析。 我们可以按照以下步骤进行数据规约: - 在 Power Pivot 数据模型中,创建 "日期"、"客户" 和 "订单" 三个表,并建立它们之间的关系。 - 使用 "数据透视表" 功能,将数据按照时间、地区、产品等维度进行聚合分析,例如计算每个客户在每个月份的销售额。
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值