目录
1、Power BI数据分析来了,您准备好了吗?
(1)Power BI安装,可以下载安装,也可以在微软应用商店安装。
(2)Power Query-M语言,数据清洗。参考课程:《Power BI商业智能分析教程--数据清洗》
(3)Power Pivot-DAX语言,数据分析。
定义:又名超级数据透视表,PowerPivot是数据透视表的强大“后台”,存在于Excel和Power BI中,以结构化的方式来存储数据,利用计算公式,为报表和可视化图表提供丰富的分析维度和度量。
使用Power Pivot可以汇聚来自各种来源的数据,允许您执行强大的数据分析和创建复杂的数据模型。
作用:数据分析。
优点:更强大的数据分析能力,更强的性能处理。PowerPivot通过使用其内存中的引擎和高效的压缩算法,能以极高的性能处理大型数据集。
那什么是DAX呢?在Power Piovt中完成的所有数据分析都是使用的公式完成的。这种公式就叫DAX公式。
友情提示:
Power Pivot主要功能是做数据分析,千万不要混淆用做数据清洗。如需数据清洗,请先在Power Query中完成,然后再导入到Power Pivot做后续的数据处理。
2、数据分析语言DAX(优雅简洁的数据分析语言)
什么是DAX?DAX公式始终以等号(=)开头。在等号后,可提供计算为标量的任何表达式,也可提供能转换为标量的表达式。
一、编写DAX公式的位置:
(1)新建表
(2)新建列
(2)度量值
二、DAX公式的应用场景:
(1)DAX在Power BI中的应用
(2)DAX在Excel中的应用
3、Power BI数据源导入(数据表格准备)
一、从Power Query中加载表格
(1)导入文件
(2)手工输入
二、在Power BI中创建表格
(1)手工输入
(2)函数生成
4、数据分析之计算列(数据分析的辅助神器)
计算列,相当于给表格加添列,属于行上下文计算。计算列占用模型加载时间,计算结果占用内存。以下是计算列的几种应用场景:
(1)做聚合时的值(不推荐)
(2)做筛选器分类(推荐)
(3)在报表行、列中做筛选(推荐)
5、数据分析之度量值(数据分析的主力神器)
度量值,返回结果一定是个标量值(单值),而不能是列或者表格。度量有测量、计量之意。度量值会受环境影响,所写DAX公式会在不同计值环境中计量出不同结果。度量值只是在查询时才计算(消耗CUP),不占用内存与磁盘空间。下面学习一下度量值在不同报表形态下的运算:
(1)一维表中的度量值
(2)二维表中的度量值
(3)图表中的度量值
(4)切片器下的度量值
6、计算列与度量值区别(DAX公式写法选择)
如果其他人发送一条DAX公式给您?如何区分是计算列公式,还是度量值公式呢?这里约定俗成的方法是:
计算列公式:列名=DAX公式
度量值公式:度量值名:= DAX公式
在Excel中必须这样区分,但在Power BI中可以直接输入“=”开始。在Power BI中也可以通过图标区分,计算列用表示,度量值用
表示。
有的数据分析需求使用计算列和度量值都能完成,但还有一些偏向设置。
适用于计算列的情况有:
(1)计算结果用于切片器、矩阵的行列区等具有筛选性质的场景。
(2)对文本或数字分类,比如“优良中差”等级分类,分数、业绩等数字的分类划分。
适用于度量值的情况有:
(1)做聚合运算
(2)能用度量值的尽量不用计算列(如单价*数量)
7、计算列与度量值数据类型(规范数据类型)
数据类型的确认是在对表做数据分析前非常重要的一项工作。在Power BI中的表格列和度量值都可以设置数据类型。
整数:DAX数据类型只有64位整数,所有整数值之间的内部计算都是使用64位整数。
十进制:十进制数总是以双精度浮点值的形式存储。
定点小数:定点小数分隔符的位置是固定的,小数分隔符右侧始终有四位数。
日期/时间:表示日期和时间值
日期:仅表示日期(没有时间部分)
时间:仅表示时间(没有日期部分)
文本:Unicode字符数据字符串。可以是字符串、数字或文本格式表示的日期。
True/False:为True或False 的布尔值。
二进制:二进制数据类型用于在数据模型中存储图像。DAX中无法使用。历史原因还暂时存