Tableau数据分析-Chapter08数据分层、数据分组、数据集
- 数据分层(层级)结构
- 分层结构的概念与意义
- 分层结构的创建与使用实例
- 数据分组
- 数据组创建及使用
- 电量销售数据按地理区域分组
- 数据集
- 数据集的相关概念
- 创建数据集
- 使用集做对比分析
数据分层结构
分层结构的概念
分层结构是一种维度之间自上而下的组织形式,Tableau默认包含对某些字段的分层结构,比如日期、日期与时间、地理角色,以日期为例,日期本来就包括年、月、日的层次结构。
分层结构的创建和案例
-
以‘全球超市订单数据.xlsx’为例
-
首先将利润->行,订购日期->列
-
选择整个视图
-
点击年(订单日期)可上/下钻
这样的一个分层结构对于维度之间的重新组合有非常重要的作用。
上钻(+)和下钻(-)是导航分层结构最有效的方法。
柱状图
以‘人工坐席接听数据.xlsx’为例
-
新建层级:点击中心->分层结构->创建分层结构->命名(层级)
-
创建层级(注意先后),创建层级:分别把中心、部、组、班依次拖入层级中
-
中心->列和颜色,人工服务接听量->行,中心下钻。
-
继续下钻,发现存在异常值,排除
折线图
- 日期->列(下拉->天),中心->行,平均呼入通话时长->行。(行可自定义下钻)
-
创建层级结构的另一种方法:选择一个维度拖放到另一个维度上->重新命名->拖动添加
层级不可以嵌套
数据分组
组是我们维度成员或度量的离散值的组合,通过分组可以实现维度成员的重新组合以及度量值的按范围分类
- 组是一个回形针的图标
- 组不能用于创建字段,不能出现在公式中。
- 创建分组也有两种方式:
①右键点击组->创建->组
②直接在图形中点击右键->组
数据组创建及使用
-
人工服务接听量->列,班->行,交换行和列
-
创建分组
-
结构显示
电量销售数据按地理区域分组
以“电量销售数据按地理区域分组.xls"为例
-
右键省市->地理角色->省/市/自治区,双击省市,编辑未知位置到所属省市
-
工作表->点击▶->套索选择->选择需要合并到一组的成员
中国一般分为七大地理地区:
1、东北(黑龙江省、吉林省、辽宁省);
2、华东(上海市、江苏省、浙江省、安徽省、福建省、江西省、山东省、台湾省);
3、华北(北京市、天津市、山西省、河北省、内蒙古自治区);
4、华中(河南省、湖北省、湖南省);
5、华南(广东省、广西壮族自治区、海南省、香港特别行政区、澳门特别行政区);
6、西南(四川省、贵州省、云南省、重庆市、西藏自治区);
7、西北(陕西省、甘肃省、青海省、宁夏回族自治区、新疆维吾尔自治区)
-
重命名:点击省市(组)->编辑组,中国地理区域->颜色,当期值->大小
各区域用电量
新创工作表界面
-
双击中国地理区域,当期值->颜色和标签,中国地理区域->标签和详细信息
-
添加说明
华东地区用电量远超其他地区
各地区电量销售标靶图
-
中国地理区域和省市->行,当期值->列,中国地理区域->颜色,月度计划值->详细信息
-
当期值->标签,右键当期值->添加参考线->分布->值:(50-100),线条/填充自由选择,填充自由选择
数据集
数据集的概念
创建数据集
静态数据集
-
以‘全球超市订单数据.xlsx’为例
-
国家地区->列,利润->行,倒叙,
-
选取负利润国家->右键创建集->命名为负利润国家
或者直接右键”国家地区“–创建–集
然后在条件部分设置利润总和小于0的
给名称重命名,最后推拽到颜色
效果:
复杂数据集
- 在上述的基础上,市场和细分市场->列,利润->颜色->编辑颜色(两色、倒序)
-
按ctrl键,将图表中蓝色的选出来。选好后右击【创建集】,修改集名称如下,点击【确定】
-
悬浮在列名上,也会有×,如果不想要改列,可以进行删除。
-
点击【清除工作表】。将【负利润国家2】拖到【列】中,将【利润】拖到【行】中。可以看到集内外变化。
-
右击【负利润国家2】——【编辑集】,删除【市场】列,点击【应用】和【确定】。
发现图表无变化,因为【市场】列变化不影响数据。
-
右击【负利润国家2】——【编辑集】,删除【国家/地区】列,点击【应用】和【确定】。
发现数据发生变化。原因是细分市场里的【公司】和【消费者】变成了内,其他的细分市场变成了外。
动态数据集
创建动态数据集
-
右击【维度】下【产品名称】–【创建】–【集】
-
修改集的名称–【条件】–勾选【按字段】,选择【利润】【总和】【<=】【0】,点击【加载】,点击【确定】
-
将【负利润产品】拖到【行】中,将【利润】拖到【列】中。点击行中【内/外(负利润产品)】的下拉三角,选择【在集内显示成员】。
通过排序方式创建动态数据集
找销量在前100的产品
-
右击【维度】下【产品名称】——【创建】——【集】。
修改集名称,选择【顶部】,勾选【按字段】,选择【顶部】【100】【数量】【总和】,就是将销量按降序排序,取前100个。点击【确定】。
合并集
合并同一个维度的数据
-
右击【负利润产品】——【创建合并集】。
-
修改集名称,左边是【负利润产品】,右边只能选择【销量TOP100】,因为两者都是从【产品名称】这个维度创建而来。
下面有四种选择:
- 合并
- 相交
- 左交
- 右交
选择相交,点击【确定】。
效果:
筛选器
通过筛选器创建数据集
-
将【地区(订单)】拖到【筛选器】里,勾选【南亚】【西亚】【中亚】【东亚】【东南亚】,点击【确定】。
-
右击【筛选器】下的【地区】——【创建集】——修改名字【亚洲地区】
-
添加【亚洲地区】为行并设置【在集内显示成员】,【利润】为列并标记为【颜色】
数据集用于分层结构
将【亚洲地区】拖到【维度】——【市场】上,弹出【创建分层结构】,修改分层名称,点击【确定】。
作业:
1、使用"全球超市订单数据"创建市场-销售条形图,将市场和细分市场合并为市场层级,显示销售额标签,图像中要下钻到细分市场层级,添加说明,导出图像;
-
将市场和细分市场合并为市场层级
-
创建市场-销售条形图,显示销售额标签
-
下钻到细分市场层级,添加说明,导出图像
⒉、使用"全球超市订单数据"筛选出中国,然后将省份按照下面的地理地区重新分组,分组后创建各地区利润的填充地图,添加地区和利润标签、分析说明,导出图像。中国一般分为七大地理地区:
1、东北(黑龙江省、吉林省、辽宁省);
2、华东(上海市、江苏省、浙江省、安徽省、福建省、江西省、山东省、台湾省);
3、华北(北京市、天津市、山西省、河北省、内蒙古自治区);
4、华中(河南省、湖北省、湖南省);
5、华南(广东省、广西壮族自治区、海南省、香港特别行政区、澳门特别行政区);
6、西南(四川省、贵州省、云南省、重庆市、西藏自治区);
7、西北(陕西省、甘肃省、青海省、宁夏回族自治区、新疆维吾尔自治区)
-
右键省市->地理角色->省/市/自治区,双击省市,编辑未知位置到所属省市
-
工作表->点击▶->套索选择->选择需要合并到一组的成员,然后重命名
-
把国家拖入筛选器,筛选出中国的城市
华东(上海市、江苏省、浙江省、安徽省、福建省、江西省、山东省、台湾省);
华北(北京市、天津市、山西省、河北省、内蒙古自治区)
华中(河南省、湖北省、湖南省);
华南(广东省、广西壮族自治区、海南省、香港特别行政区、澳门特别行政区);·西南(重庆市、四川省、贵州省、云南省、西藏自治区); ·
362660)]
[外链图片转存中…(img-JgpikoSF-1634885362661)]
-
工作表->点击▶->套索选择->选择需要合并到一组的成员,然后重命名
-
把国家拖入筛选器,筛选出中国的城市
[外链图片转存中…(img-zgTIbe8s-1634885362662)]
华东(上海市、江苏省、浙江省、安徽省、福建省、江西省、山东省、台湾省);
华北(北京市、天津市、山西省、河北省、内蒙古自治区)
华中(河南省、湖北省、湖南省);
华南(广东省、广西壮族自治区、海南省、香港特别行政区、澳门特别行政区);·西南(重庆市、四川省、贵州省、云南省、西藏自治区); ·
西北(陕西省、甘肃省、青海省、宁夏回族自治区、新疆维吾尔自治区)