PowerQuery学习总结

PowerQuery知识点总结

一、Power Query介绍

1.1 Power Query是什么

Power Query是实现数据获取和数据清理的一个工具

例如:在有很多种格式数据源的情况下,需要一个一个数据源(数据库、json、Hdfs、 文本、csv 等)去处理,让其格式统一并合并分析处理, 但是Power Query 可以解决这个问题

Excel中Power Query的位置(365版本):数据菜单下的获取和转换数据、查询和连接功能区

image-20240607174531184

1.2 Power Query的功能

  • 数据获取:从不同来源、不同结构、不同形式获取数据,并按统一格式进行横向合并、纵向(追加)合并、条件合并等

  • 数据转换:将原始数据转换成数据处理所需的结构或格式

  • 数据处理:为后续分析做准备,例如:加入行、列;处理某些单元格值等

  • 数据共享:共享到Excel或者Power Pivot进行下一步分析

  • 实现一键自动刷新:基于数据共享,源数据集更新,加载到Excel和Power Query中的数据也会更新

二、Power Query数据获取

2.1 数据获取方式

2.1.1 如何导入数据

Power Query有强大数据处理功能,几乎可以从任何来源、任何结构、任何形式上获取数据,如下图:

image-20240607180259334

2.1.2 导入数据后相关操作

image-20240607180733485

image-20240607180841765

加载:数据会被加载到excel中,并在excel显示出来

加载到:会出现选项进行选择

image-20240607181059259

  • 表:加载到现有工作表/新工作表

  • 数据透视表:会在现有工作表/新工作表创建一个数据透视表

  • 数据透视图:会在现有工作表/新工作表创建一个数据透视图

  • 仅创建连接:数据不会加载到excel中,但是Query编辑器有(只是在excel界面中看不到数据)

    好处:一些辅助表和辅助列,不用返回到excel中

数据加载流程:源数据→Power Query(数据处理)→Excel

转换数据:进入Power Query编辑器

image-20240607183628927

关闭并上载 = 导入数据时的加载

关闭并上载至 = 导入数据时的加载到

进入Power Query编辑器后,无法对excel进行操作

如何从编辑器返回到excel,点击关闭并上载或关闭并上载至

如果关闭并上载或关闭并上载至为灰色,代表之前已经执行过相关操作

导入多份数据:

  • 方式一:导入一份数据后,若其他数据和已导入数据不在一个工作簿,点击新建源→文件→Excel工作簿(或其他)

    image-20240611172700084

  • 方式二:将已导入数据关闭并上载至仅创建连接,再从数据菜单下导入数据

    image-20240611173035168

    image-20240611173128047

2.1.3 一些窗口和功能的说明

查询&连接窗口的显示:

  • 方式一

image-20240607182426107

Query编辑器的进入

  • 方式一:导入数据时点击转换数据。

image-20240607182859548

  • 方式二:导入数据后,双击查询&连接窗口的任意一个连接。

  • 方式三:导入数据后,右键查询&连接窗口的任意一个连接,选择编辑,image-20240607182934131

  • 方式四:导入数据后,点击上方查询→编辑。

    image-20240611164856197

excel中导入的某些数据不需要显示

方式:右键查询&连接窗口的任意一个连接,选择加载到里的仅创建连接。

2.2 网页数据抓取

从web中加载数据 http://www.boc.cn/sourcedb/whpj/

更加复杂的网页数据爬取在Power BI 中进行

<

Power Query是一种数据整理和转换工具,它可以帮助您从各种数据源中获取数据,并将其转换为Excel表格或数据模型。Power Query可以处理各种数据类型,包括文本、XML、JSON、数据库和Web数据等。在处理HTML文本时,Power Query可以通过使用内置的HTML解析器来将HTML文本转换为Excel表格。 使用Power Query来解析HTML文本的步骤如下: 1. 在Excel中打开“数据”选项卡,并选择“从其他来源”下的“从Web”选项。 2. 在“从Web”对话框中,输入要获取数据的网址,并单击“确定”。 3. 在“Navigator”窗格中,选择要导入的表格,然后单击“编辑”按钮。 4. 在“Power Query Editor”中,选择“添加列”选项卡,并选择“自定义列”选项。 5. 在“自定义列”对话框中,输入要提取的HTML标记或属性,例如“<td>”或“class=”name””,然后单击“确定”。 6. 在“Power Query Editor”中,您将看到一个新的列,其中包含提取的HTML标记或属性。 7. 如果需要进一步转换数据,您可以使用其他Power Query功能,例如“分组”、“过滤”、“排序”等。 8. 单击“关闭和加载”按钮,将处理后的数据加载到Excel中。 请注意,使用Power Query来解析HTML文本需要一定的技术和经验。此外,HTML文本的结构和格式可能会有很大的变化,所以这种方法并不是完全可靠的。但是,相比于使用文本函数来处理HTML文本,使用Power Query可以更快速和高效地实现数据整理和转换。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值