帕累托图,又称排列图、主次图,在反映质量问题、展现质量改进项目等领域有广泛应用,目前,也被应用到了社会生活的很多领域。在日常业务中,可以通过帕累托图分析销售额的多少百分比来自多少比例的客户,或者来自哪几种主要的产品,也就是区分出“微不足道的大多数”和“至关重要的极少数”。
![图:帕累托图示例](https://i-blog.csdnimg.cn/blog_migrate/1d3c95c3af7502ab994a850308d8fe3c.jpeg)
这里使用tableau自带的超市示例,建立客户销售额的帕累托图,查看分析前xx%的用户贡献了多少销售额。
用tableau创建帕累托图的主要步骤:
- 创建累计占比曲线
- 创建分类柱形图
- 添加参考线
最终实现的帕累托图是下面这样的:
![图:帕累托图创建结果示例](https://i-blog.csdnimg.cn/blog_migrate/d860d87e5586cc63623e6e1d0a4e7829.png)
创建累计占比曲线
创建累计占比曲线是用tableau创建帕累托图的一个难点,因为需要使用表计算函数来创建计算字段。
创建累计占比曲线主要步骤:
- 创建计算字段
- 创建曲线图
创建计算字段
根据分析需求,这里需要创建客户销售额累计占比字段,用于计算客户销售额的累计占比数据。如果用EXCEL表格来演示,该计算字段的计算结果与下面黄色列的结果是一样的:
![图:EXCEL销售额累计占比示例](https://i-blog.csdnimg.cn/blog_migrate/476b9a23a64fa27de08d29b56a974ada.png)
回到tableau,创建“客户销售额累计占比”计算字段,需要用到RUNNING_SUM和TOTAL表计算函数,具体公式如下:
![图:客户销售额累计占比字段公式](https://i-blog.csdnimg.cn/blog_migrate/5c92c85b12971ed8098670b19deea6c8.png)
TOTAL(expression):返回表计算分区内表达式的总计。该函数的默认计算依据是“表(横穿)”,会将表中的行数值进行汇总。
SUM(销售额)/TOTAL(SUM(销售额)):SUM(销售额)是每个客户销售额的总和,TOTAL(SUM(销售额))是表中所有客户销售额的总和,该计算得到的结果就是每个客户销售额占总销售额的比重。
RUNNING_SUM(expression):返回给定表达式从分区中第一行到当前行的运行总计。简单理解,该函数的作用就是将括号中表达式的结果从第一行到当前行进行逐行累加,具体在这个公式里,就是将客户销售额比重进行逐行累加。