1.提升标题
在Excel中第一行为标题行,从第二行开始才是数据,但在Power Query中,从第一行开始就需要是数据记录,标题在数据之上。一般情况下,Power Query会自动完成提升这个步骤,如果没有,或者需要手动设置时,单击功能栏的“将第一行用作标题”就可以了,如图2-3-1所示。
单击“将第一行用作标题”旁边的下拉按钮,还有一个“将标题作为第一行”选项,实际上就是拉低标题,这个功能也特别有用。
2.更改数据类型
设置正确的数据类型非常重要,在后期数据建模和可视化过程中,很可能出现一些意想不到的错误,最后发现是数据类型设置得不对,所以一开始就要养成把数据更改为合适类型的好习惯。有两种方式更改数据类型。
3.删除错误/空值
导入后的数据,有可能出现错误(Error)或者空值(null),根据分析的需要,想要删掉错误和空值,可以通过右键单击该字段选择“删除错误”,或通过单击“筛选”按钮去掉相应勾选来完成,如图2-3-3所示。
4.删除重复项
在Power Query中删除重复项非常简单,选中需要删除的列,右键单击后选择“删除重复项”即可,如图2-3-4所示。
5.填充
在Excel数据中经常会遇到合并单元格的情况,导入到Power Query后就变成了空值,如图2-3-5所示。
因此需要把数据补充完整,在Power Query中操作很简单,直接向下填充即可,如图2-3-6所示。