1.帕累托图
帕累托图(也叫做柏拉图)是“二八”原则的图形化体现。当使用帕累托图排查质量问题时,只要花费少量精力和时间解决累计占比达到80%的问题的导致因素,就能显著改善质量问题,没必要花费更多的精力和时间去解决20%的问题。
2.Tableau实现帕累托图
使用Tableau中的【超市】分析验证利润排名前20%的客户是否贡献了80%的利润总额。先来查看每个客户的利润,并按利润从大到小进行排序,具体如下:
若想把上述的图转换成帕累托图,首先需要将横轴从“客户名称”变为客户数量的累积占比。首先将“列”中的客户名称的度量改为“计数(不同)",并将“客户名称”拖拽到"详细信息“中。然后在该计算字段上添加如下表计算:
同样在行上的利润上添加同样的表计算,具体如下:
此时的结果如下:
结果好像与我们想要的结果不同,此时只需要将“详细信息”中的客户名称按“利润”从高到低排序即可。具体设置如下:
此时,最终结果为:
到此,帕累托图的基本雏形已经出来了,下面就是一些优化的部分了,比如,将“标记”改为“线”,同时添加两条常数线,最终的结果如下:
从图上可以看出,客户排名20%的客户仅仅贡献了大约60%的利润。
补充
由于在计算客户数量的累积的百分比的时候用到了嵌套表计算,因为对嵌套表计算的结果有一些疑问,所以这里需要对正文中“利润”以及“计数(不同)(客户名称)”这两个字段的嵌套表计算结果进行说明。
首先,“利润”以及“计数(不同)(客户名称)”的嵌套表计算是完全相同的,所以这里仅讨论“计数(不同)(客户名称)”的表计算设置。其次,由于原始的【超市】数据中客户数量很大,验证嵌套表计算的结果不需要使用全部的数据,所以我们仅从原始数据中挑选了11个客户。其中筛选出的客户名单如下:
先构建一个工作表,具体如下:
在上述工作表中增加一个度量值,该度量值为“计数(不同)(客户名称)"上的“汇总表计算”。并将其计算依据设置为“特征维度”下的“客户名称”(这是正文中嵌套表计算的第一层计算)。其最终结果如下(下图中的“客户数汇总”即为第一层计算结果):
再上述结果中再增加一个度量值,即为正文中“计数(不同)(客户名称)"字段上的嵌套表计算,此时结果如下(图中“客户数累积占比”即为嵌套表计算的结果):
已知嵌套表计算是在表计算的结果上再进行一次表计算。假设我们现在存在一组数据与“客户数汇总”列的结果相同,我们在改列上进行“合计百分比”表计算,其结果却与“客户数累积占比”列结果不同,具体如下:
出现上图中的结果至少说明嵌套表计算的执行过程不能简单地理解为先做主计算,然后在主计算的结果上进行从属计算。对上述结果进行分析可以发现,“合计百分比”的计算公式为:SUM([数据值])/TOTAL([数据值])。对嵌套表计算的结果进行分析,可以得出其计算公式为:RUMMING_SUM(COUNTD([客户名称]))/TOTAL(COUNTD([客户名称]))。依据此,可以另一种方法画帕累托图,创建如下两个计算字断:
然后将这两个计算字段替换掉正文中的两个字段即可。