大家好,我是小五?
继续给大家分享一波Tableau实战
对Tableau感兴趣的可以戳之前的文章补补
一天入门Tableau详细教程(上)
一天入门Tableau详细教程(下)
Tableau简介
Tableau是一款定位于数据可视化敏捷开发和实现的商务智能展现工具,可用来实现交互的、可视化的分析和仪表盘应用。Tableau提供了体验感良好且易用的使用界面,在处理大规模、多维数据时,可以即时从不同角度看到数据呈现的规律。操作简单,大大降低了技术门槛,但其呈现出来的效果却十分优秀。
本文围绕一个使用Tableau进行可视化的实例,介绍了Tableau中一些基础概念和绘图的简单操作,下面一起开始可视化之旅吧~
01 奥运会数据集可视化
数据来源:Kaggle"120 years of Olympic history: athletes and results"数据集。
包括athlete_events.csv
和noc_regions.csv
两个文件,有从1896年雅典奥运会到2016年里约奥运会的每一届奥运会的数据。
athlete_events.csv
文件包含15个字段、271116条记录。每一条记录对应一位在一项奥运会项目中参赛的运动员。
具体字段及对应含义如下:
- ID - 运动员ID编号
- Name - 运动员姓名
- Sex - 性别
- Age - 年龄
- Height - 身高(cm)
- Weight - 体重(kg)
- Team - 队伍名称
- NOC - 国家奥委会编码
- Games - 奥运会年份和季节
- Year - 年份
- Season - 季节
- City - 主办城市
- Sport - 体育运动
- Event - 比赛项目
- Medal - 获奖情况(金、银、铜、未获奖)
noc_regions.csv
描述的是国家奥委会编码与具体的国家(/地区)名称的对应关系。包含3个字段,分别是NOC国家奥委会编码、regions国家(/地区)具体名称及notes备注。
1 数据连接与管理
打开Tableau,会进入到数据源界面,可进行如下几个操作:数据连接
Tableau可连接Excel、文本文件、JSON文件、空间文件(Shapefile、GeoJSON文件等)、统计文件等多种本地数据源。在连接数据源时,如果仅需要使用部分数据,也可对数据进行筛选。
数据整合
Tableau可对来自不同数据表的数据实现多表合并(行)、多表联接(列)及多个数据源的融合。行合并通过【新建并集】实现,使用并集合并的表需要有相同的结构,即相同字段数,且相关字段名称和数据类型匹配。列合并通过【联接】实现,需要选择同名字段作为关联字段,有四种联接类型,即内部、左侧、右侧、完全外部联接,默认是内部联接。
注:在2020.2之后的版本中,数据源使用的数据模型具有两个层:一个逻辑层(在其中关联表),一个物理层(在其中联接或合并表)。更推荐使用【关系】来连接数据,关系是一种更灵活、动态的方式,根据关联字段确定联接可能性,而不创建新的固定表。
数据加载
Tableau有两种加载数据的方式,一是实时连接,从数据源获得查询结果;另一种是数据提取,将数据提取到Tableau数据引擎中进行管理。