Power BI数据分析实战——基于原数据表提取数据生成新表

今年刚刚接触数据分析相关的内容,使用的第一款数据分析软件就是Power BI,第二款是Tableau,个人感觉Power BI会比较好用一些,也是免费的数据分析软件。

最近在做一些数据库的数据分析的时候,遇到了一个问题,觉得比较经典,于是记录一下。

场景描述

从数据库拉出一堆数据,结果发现大多数据基于数据库都无法处理,举个简单的例子,从数据库拉出的数据如下:

日期事件人数
2023/4/18摸鱼12
2023/4/18吃饭39
2023/4/18打螺丝112
2023/4/18办公60
2023/4/18管理20
2023/4/19摸鱼6
2023/4/19吃饭50
2023/4/19打螺丝130
2023/4/19办公45
2023/4/19管理15
2023/4/20摸鱼10
2023/4/20吃饭69
2023/4/20打螺丝109
2023/4/20办公67
2023/4/20管理24

(以上数据纯属瞎写,仅用于举例子)

而我需要的数据是在每一天中摸鱼的人数占总人数的比,或管理人员占打螺丝人数的比,又或是办公室人员占打螺丝人数的比。像这种类似的数据,我觉得在工厂的数据库里应该是比较常见的,如果只是采用excel里面的方法去做的话,工作量无疑是巨大的,因为工厂里面的数据需要分析的少说也有半年一年的,而一天的数据远不止我列举的这些。

解决方法

使用Tableau可以实现上述的问题,只需要一小段代码就可以,但是我个人不喜欢用Tableau的原因有两个,一是它收费,二是对于数据太大的数据库,Tableau查询数据库太慢了(也可能是我操作不当,有时候查询半个小时都没查询完,我都懒得等了),也没有一个进度条,查询数据的时候只告诉你已经查询了几分钟,也不说还剩几分钟。

接下来介绍如何用Power BI去解决这个问题。Power BI有两个函数可以基于原数据表,生成新的数据表,分别是SUMMARIZE()和SUMMARIZECOLUMNS()。两个公式是一个筛选条件和多个筛选条件的关系。从原数据表提取想要的数据,就要有筛选条件,要知道自己想要的是什么数据。

函数详解

SUMMARIZE()可以实现的功能,SUMMARIZECOLUMNS()都可以实现,所以这里主要介绍SUMMARIZECOLUNS()的使用方法。

 这个函数可以包含很多的参数(上限不知道,我使用的时候还没有达到过上限),第一个名称前都是筛选条件,名称后面就必须是一个计算的表达式,当开始了第一个名称,后面必须全部都是名称-表达式,名称-表达式的参数。

问题解决

由于只是举个例子,不会过多的去解决问题,如果有不懂,欢迎评论区留言,一起交流学习。

现在针对每天管理人数占打螺丝人数比例的变化情况进行分析。首先需要把每天的管理人数和打螺丝人数从数据中提取出来,方便后续调用。这里通过新建列的方式用简单的IF()函数就可以实现。

 当我们把需要的数据从数据库从提取出来后,就可以通过新建表的方式来计算占比变化。

  新建的表格通过SUMMARIZECOLUMNS()就可以实现把想要的数据提取出来了,再新建一列,把两个数据一除就可以得到占比。

 用这个函数就可以实现从数据库的一堆数据中筛选出自己想要的数据,筛选条件只需要在“管理”前面继续加就行了,比如班次,区域之类的,我这里只是简单举例,所以筛选条件只放了时间。

 结语

本人也只是个数据分析小白,才刚接触不久,如果有幸让数据分析大师看见了,觉得这个方法不行,太麻烦了,欢迎在评论区指点我一下。

  • 3
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

雪菲人

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值