终于进入正题啦~
前面我们介绍了Power Query的基本情况,以及如何启动,导入并刷新数据。
前文回顾: Power Query 自学教程
接下来,我将介绍Power Query的数据处理功能,本篇主要围绕非数值型数据处理展开,包括日期数据,文本数据等等。
一、日期处理
在Power Query中,我们可以对日期进行各种形式的转化和提取。
比如针对2021/5/15这个日期,可以进行不同操作获得以下结果:
1.【年】
年:2021,年份开始值:2021/1/1,年份结束值:2021/12/31
2.【季度】
季度:2(表示第二季度),季度开始值:2021/4/1,季节结束值:2021/6/30
3.【月份】
月份:5,月份开始值:2021/5/1,月份结束值:2021/5/31,一个月的某些日(翻译成人话:这个月有多少天):31,月份名称:五月
4.【周】-常用
一年的某一周:20,一月的某一周:3,星期的开始值:2021/5/10,星期的结束值:2021/5/16
5.【天】
天:15,每周的某一日:5(周六的意思,周一是第0天),一年的某一日:135,星期几:星期六
二、合并查询
最常用的功能之一,通过关键列建立两个表的连接,类似于excel的vlookup,sql的join,使用简单但功能强大。
合并查询常用的联接种类以下四类:
内部(仅保留两个表中的匹配行),等同于sql中的inner join;
左外部(保留当前表中所有行,对应表中的匹配行),等同于sql中的left join,excel的vlookup;
右外部(保留当前表中的匹配行,对应表中的所有行),等同于sql中的right join;
完全外部(保留两个表中的所有行),等同于sql中的full outer join。
下面这张图可以直观展示:
!!!需要注意一点:用于匹配的表,必须先对关键列删除重复项再进行合并查询,否则当前记录会递补上所有匹配结果。