Power Query数据清洗的常用操作

本文介绍了Power Query在数据清洗和预处理中的常见操作,包括提升标题、更改数据类型、删除错误/空值、删除重复项、填充、合并列、拆分列、分组、提取、行列转置、添加列、追加查询和合并查询等,这些操作对于数据分析和业务理解至关重要。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.提升标题

在Excel中第一行为标题行,从第二行开始才是数据,但在Power Query中,从第一行开始就需要是数据记录,标题在数据之上。一般情况下,Power Query会自动完成提升这个步骤,如果没有,或者需要手动设置时,单击功能栏的“将第一行用作标题”就可以了,如图2-3-1所示。
在这里插入图片描述
单击“将第一行用作标题”旁边的下拉按钮,还有一个“将标题作为第一行”选项,实际上就是拉低标题,这个功能也特别有用。

2.更改数据类型

设置正确的数据类型非常重要,在后期数据建模和可视化过程中,很可能出现一些意想不到的错误,最后发现是数据类型设置得不对,所以一开始就要养成把数据更改为合适类型的好习惯。有两种方式更改数据类型。
在这里插入图片描述

3.删除错误/空值

导入后的数据,有可能出现错误(Error)或者空值(null),根据分析的需要,想要删掉错误和空值,可以通过右键单击该字段选择“删除错误”,或通过单击“筛选”按钮去掉相应勾选来完成,如图2-3-3所示。
在这里插入图片描述

4.删除重复项

在Power Query中删除重复项非常简单,选中需要删除的列,右键单击后选择“删除重复项”即可,如图2-3-4所示。
在这里插入图片描述

5.填充

在Excel数据中经常会遇到合并单元格的情况,导入到Power Query后就变成了空值,如图2-3-5所示。
在这里插入图片描述
因此需要把数据补充完整,在Power Query中操作很简单,直接向下填充即可,如图2-3-6所示。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值